מה זה מפתוח ומדוע חשוב למפתח נכון פרטי מידע?

On 1 Nov., 2014

על חשיבות המיפתוח (indexing) ככלי לאפיון מדויק של פריט התוכן. כל זאת, לשם אחזור נכון שלו.

מה זה מפתוח ומדוע חשוב למפתח נכון פרטי מידע?

ההגדרה המוצגת באתר OneLook (אשר מציג רשימת מילונים אלקטרוניים אשר מילת החיפוש שחיפשנו מופיעה בהם), היא זו:

noun: "the act of classifying and providing an index in order to make items easier to retrieve

זו הגדרה קולעת; מיפתוח הוא למעשה ניתוח התוכן של פריט המידע (=מהו נושא הפריט).

ניתוח אשר נועד לאפשר למשתמשי הקצה שלנו (end-users), שמחפשים את התוכן שהזנו באתר שלנו, למצוא את הפריט הזה בקלות.

מדוע מפתוח חשוב כל כך?
תשובה: מכיוון שקיים הרבה מידע.

הרי אם במאגר המידע שאנו מקימים יש רק 20 פריטים והמשתמש שלנו מחפש פריט מסויים, הוא יכול לדפדף בין ה 20 ולברור לו את המתאים ביותר (אם אכן מצא פריט הולם את צרכיו).

אלא שמדובר בעשרות ומאות פריטים במאגר מידע נתון ולכן צריך לתת מפתח בידי המשתמש שלנו – מפתח להגיע לפריטים הרצויים לו  ויותר מכך, להגיע רק אליהם (כלומר, שיקבל תוצאות חיפוש "נקיות" ורלבנטיות).

האופן הנכון למיפתוח פריט ידע הוא באמצעות 4 ה"פנים" של תוכן הפריט (הם מכונים גם ארבעת ה W):

What – Who – Where – When

כשאנו מנתחים תוכן של פריט, נשאף לתת מילת מפתח שעונה על ה WHAT – באיזה נושא דן הפריט.

נשאף גם לתת מילת מפתח שעונה על ה WHO – במי דן הפריט (לדוגמא, נפוליאון).

ניתן גם מילת מפתח שעונה על ה WHERE – מהו המקום הגיאוגרפי שמאוזכר בפריט ומהותי לתוכנו
וכן – נענה על ה WHEN  – מילת מפתח שמרפררת על הזמן שבו דן הפריט.

פריט מידע מנותח באמצעות מספר שדות:

שדות בבליוגרפיים – אודות הפריט, שאינם חלק מתוכנו (שם המחבר, שנת הפרסום, שם ההוצאה, עיר ההוצאה, סוג הפריט).
שדות התוכן – כותר, מילות מפתח, שדה תיאור הפריט.

כאשר אנו מחפשים במנוע חיפוש מידע, אנו נחשפים לשם הפריט ולתיאור שלו. מילות המפתח אגב סמויות מן העין אך מנוע החיפוש מאתר באמצעותן פריטים שרלבנטיים לשאילתא שהקשנו ומציג לנו פריטים אלה.

באמצעות המידע הראשוני של התוכן (הנחשף בתוצאות החיפוש) אנו בוררים את המידע ומחליטים האם להתעמק בפריט מסויים או להמשיך לפריט הבא.

כאן אציין סטנדרט מאוד חשוב בעולם המידענות (שהשפיע על אופן הצגת התוכן האינטרנטי בכלל):

The Dublin Core

בשנת 1995 נפגשו בדבלין, אוהיו, מידעניות ומידענים מנוסים מכל העולם והחליטו על 15 שדות אפיון הכרחיים של פריט אינטרנטי.

כמובן שבין השדות החשובים כלול גם שדה מילות המפתח.

לפני שנעמיק מעט יותר בנושא המיפתוח, נשאל שאלת מפתח   – למה זה מעניין אותנו (את מזיני וכותבי תוכן אתר הארגון, את מנהלי התוכן)?

או, אנו, עוסקי התוכן על כל גווניו צריכים לזכור שאנו עושים את כל העבודה הזו בשביל המשתמשים שלנו; מטרתנו היא אחת – שהמשתמשים ימצאו את כל החומר שהם מחפשים וכמו שהזכרתי קודם – רק את התוכן הזה.

אז הגענו לפרקטיקת המיפתוח עצמה.

כיצד נאפיין תוכן של פריט?
תשובה – באמצעות מילים.
אלו מילים? מילות מפתח.

כיצד נחליט איזו מילה נכונה יותר (לדוגמא – תפוז או תפוזים)?

חשוב – נעבוד עם תיזאורוס (רשימת מונחים היררכית) של תחום התוכן שלנו (אם אנו ממפתחים מאמרים מתחום הרפואה נעבוד עם תיזאורוס רפואי ואם מאמרים בוטניים אז התיזאורוס יהיה מורכב בעיקר ממונחים של תחום הבוטניקה).

כשאנו ממפתחים נשאל כל הזמן את עצמנו – מהי מילת המפתח שבאמצעותה המחפש שלנו יחפש את הפריט הזה?מהו מספר מילות המפתח שניתן לפריט?

המספר האידאלי הוא – אחד. אך כמעט ולא קיים מצב כזה, מכיוון שניתוח התוכן מאלץ אותנו בדרך כלל לאפיין את הפריט במספר מילים.

בכל מקרה, חשוב להגביל את כמות המילים שניתן לפריט והמספר ינוע בין 5 ל 10 מילים.
(חשוב להגביל בעיקר מהסיבה שאם תהיינה הרבה מילות מפתח לפריט נתון הרי שבחיפושים רבים במאגר המידע שלנו יעלה אותו הפריט עצמו, מצב שאינו נכון. הפריט צריך לעלות רק כאשר מחפשים את התוכן שלו, ולא לעלות שוב ושוב בשאילתת החיפוש רק מכיוון שלא דייקנו בניתוחו).

לא פחות חשוב: עד כמה מילות המפתח תהיינה ספציפיות?
תשובה: מילות המפתח קורלטיביות לתוכן הפריט עצמו – אם הפריט הוא כללי ומזכיר מספר מקומות גיאוגרפיים ומספר גידולי צמחים (לדוגמא), הרי שניתן מילות מפתח כלליות יותר (מלות מפתח של אזור גיאוגרפי, המילה הכללית בוטניקה או גידולים חקלאיים) בעוד שאם הפריט הוא מאוד ספציפי ומפורט לגבי מקום גיאוגרפי אחד וזן אחד של צמח, הרי שננקוב בשם המקום עצמו (אם לדעתנו המחפש שלנו יתעניין דווקא במקום הגיאוגרפי) וכן ננקוב בשם הגידול.

מהסקירה הקצרה הזו אלו עקרונות ניתוח ניתן לגזור?

  1. נעבוד עם תיזאורוס של תחום התוכן של פריטי המידע שלנו.
  2. עומק המיפתוח קורלטיבי לאופי התוכן (תוכן רחב-מילות מפתח כלליות, תוכן צר – מילים נקודתיות).
  3. פרקטיקת המפתוח: על פי ארבעת הפנים של תוכן הפריט.

ואחרון, הרשו לי לתת כאן קרדיט לד"ר רחל קידר, מאוניברסיטת בר-אילן המחלקה ללימודי מידע, מומחית לקטלוג ולמפתוח, אשר סייעה בידי בעת שעשיתי את צעדי הראשונים בהנחיית סדנאות מפתוח בארגון.

למידע נוסף, ניתן לקרוא בבלוג שלי

http://findout.co.il/326

Read more...