גוגל משתמשת בכלי חדש כדי לעזור להבין שמות חיסונים, אבל זה יכול לשנות גם את החיפוש לנצח
סגן נשיא חיפוש Google, Pandu Nayak, מסביר מדוע האפשרויות של הכלי Multitask Unified Model (MUM) של החברה הן אינסופיות.

אותו דבר בעל שמות דומים בחלקים שונים של העולם או בתרבויות, הוא בעיה שנתקלה בחיפוש בגוגל במשך זמן רב. אז כשהתמודדה עם אתגר דומה סביב שמות החיסונים ל-Covid-19, ענקית הטכנולוגיה פנתה לכלי החדש שלה Multitask Unified Model (MUM) לעזרה.
מאחר ולחיסונים AstraZeneca, CoronaVac, Moderna, Pfizer, Sputnik אחרים בתפוצה רחבה יש לכולם שמות רבים ושונים בכל רחבי העולם, היכולת של גוגל לזהות נכון את כל השמות הללו היא קריטית כדי להביא לאנשים את המידע העדכני והאמין על החיסון. אז עכשיו פלטפורמת החיפוש משתמשת ב-MUM כדי לזהות למעלה מ-800 וריאציות של שמות חיסונים ביותר מ-50 שפות תוך שניות, כתב Pandu Nayak, עמית גוגל וסגן נשיא, Search בפוסט בבלוג. לאחר אימות הממצאים של MUM, החלנו אותם בחיפוש Google כדי שאנשים יוכלו למצוא מידע בזמן ואיכותי על חיסוני COVID-19 ברחבי העולם.
MUM היא רשת עצבית עמוקה המורכבת משנאים בדיוק כמו BERT (ייצוגי קודן דו-כיווני של רובוטריקים), מסביר Nayak בשיחה. בשנת 2018 השיקה גוגל את BERT, טכניקה מבוססת רשתות עצביות לאימון מקדים לעיבוד שפה טבעית (NLP), המאפשרת לכל אחד לאמן את מערכת המענה לשאלות המתקדמת שלו. אבל במובנים רבים MUM שונה מאוד מבERT. כמו BERT הוא יכול להבין שפה באמצעות מקודדים... אך בנוסף לכך יש לו גם ערימה של מפענחים המאפשרת לו ליצור טקסט, אומר Nayak, ומוסיף שהארכיטקטורה המסוימת הזו היא מודל טקסט לטקסט המבוסס על ארכיטקטורת T5 שפותחה על ידי מחקר של גוגל.
חדשות הטכנולוגיה המובילות עכשיו לחץ כאן למידע נוסף
Nayak אומר ש-MUM הוכשרה על תת-קבוצה איכותית של קורפוס האינטרנט לאחר השמטת תוכן באיכות נמוכה. זה גם הוכשר בכל 75 השפות בו זמנית, כך שבאופן מהותי זה מודל רב לשוני. הוא מסביר את היתרונות: מה שמאפשר לנו לעשות זה להכליל משפות עשירות בנתונים לנתונים לשפות שבהן יש פחות מסמכים. כמו כן, MUM הוא ביסודו סוג של אימון רב-מודאלי ויכול להתרחב לתמונות וכדומה.
זה בעצם אומר שהמודל יכול ללמוד בשפה אחת ולהפיץ את הידע בשפה אחרת. כמו כן, עבור גוגל זה מתורגם כמנגנון חכם שלא צריך ללמוד בנפרד בכל השפות.
ההזדמנויות הן אינסופיות. אנו חושבים על זה כעל פלטפורמה שבה צוותים שונים יכולים להשתמש בפלטפורמה זו למקרי שימוש אישיים משלהם. אז צוות אחד עשוי להשתמש בו כדי לשפר את הסיווג, אחד כדי לשפר את הדירוג ואחר עבור מיצוי מידע, ועוד אחד כדי ליצור אפליקציה חדשה לגמרי. אז זה מטבעו ריבוי משימות..., הוא מדגיש.
זיהוי שם החיסון הוא רק ההתחלה של מה שיכול להיות משהו גדול. הפוסט בבלוג מרחיב: הבדיקות המוקדמות שלנו מצביעות על כך שלא רק ש-MUM תוכל לשפר היבטים רבים של המערכות הקיימות שלנו, אלא גם תעזור לנו ליצור דרכים חדשות לחלוטין לחיפוש ולחקור מידע.