מהדורה 112: חיפוש אחר רווחים, תשתית אינטגרטיבית, ״חיפוש הוא זול מדי״, התקווה של גוגל בבינה מלאכותית, מותם של הלינקים
״בעוד שוול סטריט התמקדו במלחמות הפורטלים, המאבק לשליטה בחיפוש לא עניין אף אחד מלבד קומץ אנליסטים. לא היה בזה כסף.״
שוב יום שישי. הבלוג ייצא להפסקה בשני ימי שישי הקרובים – פסח שמח לכולם – וביום שישי שלאחר יום העצמאות; המהדורה הבאה תתפרסם ב 25.4, וזו שאחריה ב 9.5. אתם יכולים להשתמש בזה בתור הזדמנות לקרוא מהדורות קודמות, או יותר טוב – ברוח ההצעה של כריסטנסן – לנצל את ההפוגה ממני כדי לבלות יותר זמן עם המשפחות שלכם.
החלק הראשון במהדורה של היום הוא תרגום של פוסט שפרסמתי השבוע באנגלית. הבלוג באנגלית הוא חדש עבורי, ואני אשמח אם תעזרו לו להגיע לעוד קוראים: אם אתם עובדים, או לומדים עם, או סתם מכירים, אנשים שאולי יתעניינו בנושאים של הבלוג, ואינם דוברי עברית — תשקלו לספר להם על הבלוג. אפשר למצוא אותו כאן.
קדימה למהדורה מספר 112 -
בחיפוש אחר רווחים
בספר שלו, I'm Feeling Lucky: וידיים של עובד גוגל מספר 59, דאגלס אדוארדס תיאר את המאבק שלו בהתחלה לפתח תקוות עבור סיכויי ההצלחה של גוגל לבנות עסק רווחי (ולאופציות שלו לצבור ערך). ככה הוא תיאר את הסביבה המאתגרת של חיפוש באינטרנט בסוף 1999:
עמוד הבית של יאהו הכיל לינקים לבגדים, מחשבים, DVDs, חופשות, תכניות טלוויזיה, מזג אוויר, משחקים, דפי זהב, ציטוטי מניות, וצ׳אט. הוא נהיה עמוס יותר בכל יום שחלף. הפיצ׳ר המרכזי בדרך היה הספריה שיאהו בנתה באופן ידני עם 14 הקטגוריות הראשיות שלה, מאומנות ועד לתרבות וחברה, ומתחת לכל אחת היו לינקים לכל הנקודות הידועות בשיטת המספור של דיואי. קבורה בין כל הלינקים הייתה תיבת חיפוש שהופעלה על ידי האויב המר שלנו אינקטומי.
אינקטומי לא תמיד החזיקה בשטח הזה. אלטה ויסטה סיפקה את החיפוש ליאהו עד 1998, אבל הם עשו את הטעות הפטאלית של לבנות אתר פורטל משלהם ולגנוב משתמשים מהלקוח שלהם (להתחרות עם המפיץ של עצמך ידוע בתור ״channel conflict״). לאינקטומי לא היה אתר חיפוש consumer-facing, אז הם לא היו מתחרים של יאהו, מה שגם פינה להם את הדרך לרשת MSN של מיקרוסופט ולאמריקה אונליין (AOL). אינקטומי סגרה גם את הלקוחות האלה, השלימה את שלישיית האתרים עם הטראפיק הכי גבוה באינטרנט, והביאה למצב שבו החיפוש ברחבי האינטרנט הפך לקומודיטי. אתם יכולים לקבל חיפוש באיזה סגנון שתרצו, כל עוד זה היה אינקטומי. הם שלטו בשוק החיפוש וישבו עליו, שמנים ושמחים כמו הלקוחות העצומים שהם שירתו.
פורטלים אחרים רצו נתח מהטראפיק של יאהו: אקסייט, לייקוס, וגו.קום של דיסני. וחברות חיפוש אחרות, כמו AlltheWeb, טהומה, והוטבוט, נלחמו לצד גוגל על הפירורים שנפלו מהשולחן של אינקטומי. בעוד שוול סטריט התמקדו במלחמות הפורטלים, המאבק לשליטה בחיפוש לא עניין אף אחד מלבד קומץ אנליסטים. לא היה בזה כסף.
השקפה דומה של ״אין כסף בחיפוש״ הוצגה במהדורת מאי 2000 של Upside, מגזין מסן פרנסיסקו לתעשיית ההון-סיכון (שפשט רגל ב-2002). מאמר שזכה לכותרת חיפוש אחר רווחים, ציין שלמרות המעמד היוקרתי של אינקטומי בתור ספקית החיפוש הבלעדית ליאהו, AOL ומיקרוסופט – שלושת האתרים עם הטראפיק הגבוה ביותר באינטנט בזמנו – החברה עדיין הפסידה כסף. הוא גם ציין איך גוגל הצליחה למשוך קצת טראפיק באמצעות טכנולוגיה עדיפה, אבל סיכם שזה הנכס העיקרי (והיחיד) שלה. המאמר מסתיים בשאלה הפתוחה, האם ״הובלה טכנולוגית תתורגם בנקודה מסויימת לעסק רווחי״.

התשובה, כמובן, הייתה כן מהדהד. הובלה טכנולוגית בחיפוש לבסוף תורגמה לאחד העסקים הרווחיים ביותר בהיסטוריה האנושית. בעוד שזה היה רחוק מלהיות מובן מאליו במאי של שנת 2000, זה מאד ברור היום, ותיאוריית האגרגציה עושה עבודה פנטסטית בלהסביר למה זה המצב.
מה שאולי לא לגמרי מובן מאליו, עדיין, זה איך גוגל השיגה עליונות טכנולוגית מלכתחילה.
תשתית אינטגרטיבית
בעוד שאלגוריתם PageRank – דרך מתוחכמת לקבוע את החשיבות של עמוד ווב, שפותחה על ידי לארי פייג׳ בשנות לימודיו לדוקטורט בסטנפורד – היה פריצת הדרך הראשונית שאיפשרה לגוגל להמריא בתור מנוע חיפוש עדיף, זו הייתה רק הראשונה מבין שורה ארוכה של פריצות דרך מתוחכמות וחדשניות. הן היו הכרח, בזמן שההתפוצצות של האינטרנט לחצה על גוגל להוסיף עוד ועוד עמודי ווב לאינדקס שלה – בתדירות גבוהה יותר – ובאותו הזמן להגיב – מהר יותר — ליותר ויותר שאילתות של משתמשים. ובמקביל לכל זה, עלויות החומרה איימו לצאת משליטה.
הספר I'm Feeling Lucky מתאר ביקור בשטח הדאטה-סנטר שגוגל שכרה מאקסודוס, ספקית הדאטה-סנטר הגדולה בעולם נכון לשנת 2000; בניגוד בולט לאיזורים הנקיים והמאורגנים של איביי, יאהו, ואינקטומי, האיזור שתפסה גוגל ״הרגיש כמו בקתה עם פארטץ של הרחבות לא חוקיות, שמזהמת שכונה של אחוזות מוקפות חומה. בכל סנטימטר דחפו מארזים שהתפקעו ב-CPU ערומים״.
גוגל הצליחה לדחוס מעל 1,500 מכונות; פי 30 ממספר השרתים שהמתחרה שלה, ספקית החיפוש אינקטומי, התקינה בכלוב השכן. אדוארדס הסביר:
גוגל ניצלה פרצה בחוקי הכלכלה של הדאטה-סנטר. אקסודוס, כמו רוב מרכזי ההוסטינג, גבתה מהדיירים שלה לפי מטר רבוע. אז אינקטומי שילמה על אירוח חמישים שרתים כמו שגוגל שילמה על אלף וחמש מאות. והבונוס? חשמל, שהופך להיות יקר באופן מפתיע כשצורכים מספיק כדי להאיר שכונה שלמה, היה כלול בשכירות. כשניהלו מו״מ על חידוש החוזה עם אקסודוס, ג׳ים, מנהל המערכות הראשון של גוגל, אמר בדיוק כמה חשמל הוא צריך. לא שמונה מעגלים של 20-אמפר שבדרך כלל היו מקצים לארון שרתים בגודל של גוגל; הוא רצה חמישים-ושישה.
״אתה רק רוצה את זה למקרה שיהיה זינוק רגעי, נכון?״ שאל נציג המכירות של אקסודוס במבט מופתע. ״אין סיכוי שאתה באמת צריך כל כך הרבה חשמל לארון שרתים בגודל כזה״.
״לא״, ג׳ים אמר לו. ״אני צריך את כל החמישים-ושישה כדי להריץ את המכונות שלנו״. השמועות הן שברגע מסויים צריכת החשמל של גוגל הייתה פי 50 מההערכות של אקסודוס. זה לא עזר שגוגל לפעמים הדליקה את כל המכונות שלה בבת-אחת, מה שפיצץ מפסיקי-זרם על ימין ועל שמאל עד שגוגל הוסיפה דיליי של חמש שניות כדי לא לשרוף את הבניין.
גם מיזוג-אוויר הגיע באופן סטנדרטי. שוב, אקסודוס ביססו את החישובים שלהם על עקומת סבירות. אף חברה סבירה לא תדחוס 1,500 תנורים בוערים לתוך ארון שרתים בודד, כי זה ידרוש התקנת יחידת קירור נפרדת. גוגל עשתה את זה. היינו לקוח שדרש הרבה תחזוקה.
וגוגל הלכה מעבר לניצול פרצות והזדמנויות לסחוט את הספקים שלה – היא גם סחטה כל מה שיכלה מהכסף שהוציאה על חומרה: השימוש ב״commodity hardware״ (תחשבו: מחשבים זולים שמפסיקים לעבוד לעיתים תכופות), וזיכרון מסוג פשוט בעקבות מחסור עולמי, דחפו את גוגל לעצב את ארכיטקטורת התוכנה שלה ככה שתהיה עמידה באופן קיצוני לבעיות חומרה.
והנה עוד סיפור מאדוארדס:
לארי, אורס, וכמה מהנדסים נוספים זרקו את כל רכיבי השרת על השולחן ולקחו תורות בלארגן את החלקים על מגש לוח שעם כמו פאזל. המטרה שלהם הייתה לדחוף לפחות ארבעה לוחות-אם בכל מגש. את המגש יחליקו לתוך פתח במעמד מתכתי בגובה שני מטר וחצי. מאחר ובדרך כלל לא מחברים שרתים למסך, הם נפטרו מכרטיסי מסך שבזבזו מקום.
ברוך שפטרנו – חוץ מזה שכשמשהו מת לא הייתה לצוות התפעול דרך להבין מה קרה, כי הם לא יכלו לחבר מסך למעבד הבעייתי. ובכן, הם יכלו, אבל הם היו צריכים קודם לדחוף כרטיס מסך בזמן שהמכונה עדיין רצה, כי לארי הוריד את המתגים שכיבו את המכונות.
״למה שאי פעם תרצו לכבות שרת?״ הוא תהה.
אני מאד אוהב את הסיפור הזה. חומרת מחשוב היא המשלים של מנוע חיפוש בסקייל של האינטרנט, ולארי פייג׳ הפך את המשלים של המוצר שלו לקומודיטי ומודולרי, בידיו החשופות. מתגי הכיבוי של השרתים לא היו הדבר היחיד שגוגל קבעה שמיותר; במסע שלה להגדיל את הסקייל ולהוריד את העלויות, גוגל חיברה יותר ויותר ממה שבאופן מסורתי היה נמכר כמוצרי IT נפרדים – תקשורת, אבטחה, דאטהבייס, סטורג׳ – לתוך תשתית התוכנה ה proprietary, באמצעות רצף מדהים של חדשנות אחרי חדשנות, שכולם נתפרו ועברו אופטימיזציות ספציפית כדי לתמוך במנוע החיפוש של גוגל.
ההתמקדות האינטנסיבית בחיפוש, וגישת האינטגרציה ההדוקה שהפכה לליבת האופי של גוגל, היא מה שעשתה את זה מאתגר עבור גוגל לפתוח את התשתית שלה ולהציע אותה בתור פלטפורמה. זו הסיבה שגוגל התקשתה בתחילת עידן הקלאוד (זה חוזר לטרוניה של סטיבי שהזכרתי כבר במהדורה מספר 3, למרות שכמובן לגוגל קלאוד הולך הרבה יותר טוב היום). אבל עוד על זה בפוסט נפרד; בינתיים – כמו צוותי התשתית של גוגל בזמנו – אני רוצה להמשיך להתמקד בחיפוש.
״חיפוש הוא זול מדי״
עם הזמן, אדוארדס הפך להיות אופטימי לגבי גוגל:
החוזה של אינקטומי לספק תוצאות חיפוש ליאהו עמד לפני חידוש ביוני 2000, ויאהו לא רצתה להאריך את השותפות … הם רצו שגוגל תספק חיפוש באתר שלהם, כמו שעשינו עבור נטסקייפ. אם משתמשים לא יוכלו למצוא את מה שרצו בספריה של יאהו, הם ישתמשו בגוגל כדי לחפש בווב.
למה השינוי? אינקטומי ראו בחיפוש לפורטל כעסק צד לא רווחי – הם התמקדו בשירותי חיפוש לרשתות פנימיות של חברות גדולות – ככה שהם לא הרגישו צורך לדחוף את עצמם בשביל יאהו. זה פתח את הדלת בשביל גוגל.
מה שעמד מאחורי ההחלטה של יאהו לעשות אאוטסורס לחיפוש באתר שלה, כמו גם הבחירה של אינקטומי ללכת מהעסקה, כנראה היה הקונצנזוס הנרחב שראה בחיפוש כעסק קומודיטי. לכל מנועי החיפוש יש טעם של עוף. ואף אחד מהם לא הרוויח כסף. את הכסף האמיתי היה אפשר להרוויח בפורטלים, אתרים שממש הציעו תוכן. תוכן משאיר יוזרים באתר – ומספק הזדמנויות להראות להם פרסומות – בעוד שחיפוש פשוט דוחף יוזרים לאתרים אחרים, ובכך מאבד את האפשרות לעשות להם מונטיזציה.
גוגל, בניגוד לזה, סירבה לחשוב על חיפוש בתור קומודיטי, בהינתן קצב ההשתפרות של הטכנולוגיה שלה; היעד השאפתני שהציבה העסקה עם יאהו הייתה אינדקס בגודל מיליארד אתרי ווב, שמתעדכן באופן שוטף.
באמצעות חדשנות בבניית תשתיות, העלות-לשאילתא עבור גוגל ירדה עד כדי כך שלארי פייג׳ החל להגיד ש״החיפוש זול מדי״. I'm Feeling Lucky מסביר:
להוציא כסף על שיפור איכות החיפוש ייצור פער מוחשי בין התוצאות של גוגל לאלו של המתחרים, מה שיאפשר לנו לבנות מותג שמתבסס על איכות. חברות חיפוש אחרות יצטרכו להשקיע ברמה דומה או גבוהה יותר רק כדי להדביק אותנו. אנחנו ניצור מלחמת חימוש ונגרום ליריבים שלנו לבזבז את דרכם לפשיטת רגל. ״הגדלת עלות החיפוש למעשה תעלה את הרווחים שלנו״, אורס האמין. ״שורת ההכנסות עומדת לגדול הרבה יותר מהר מהשורה התחתונה, והמרג׳ין באמת מאד גבוה״.
לארי וסרגיי רצו להתמקד ביעילות, אבל הם גם רצו לגלות כמה יותר טובה גוגל יכולה להיות אם יזרקו פי שתיים מכונות על הבעיה של איכות החיפוש. אז הם עשו ניסוי.
״ב-2001,״ סאנג׳יי מספר, ״ישבתי במשרד של לארי והוא פשוט אמר, ׳הנה שלושת אלפים מכונות בשבילך. תבינו אתם מה לעשות עם זה.׳״
מאד קשה, בתקופות של שינויים טכנולוגיים משמעותיים, לחזות איך שרשראות ערך יתארגנו בסופו של דבר; יאהו הניחה שחיפוש הוא קומודיטי (כפי שהאמינו גם כולם), וניסתה לבנות עסק בר קיימא ע״י אינטגרציה של כמה שיותר תוכן לצד ספריית אתרי האינטרנט שלה. בהנחה שחיפוש הוא טוב-דיו – ושלמשתמשים לא אכפת אם אלטה ויסטה תוחלף באינקטומי או גוגל – יאהו לא הצליחה לדמיין כמה גדול האינטרנט עשוי להיות; הפיצוץ של אתרי אינטרנט הפך את התוכן עצמו לקומודיטי, ואת היכולת לחפש ולגלות אותו לרכיב הקריטי בשרשרת הערך. היכולת הזו לעולם לא טובה-דיה, ולשם בסופו של דבר זרם הערך. גוגל הצליחה לתפוס את הערך הזה על ידי אינטגרציה של אינדקס של כל האינטרנט, יחד עם תשתיות ה-IT שהיו דרושות כדי להפעיל אותו, והאלגוריתמים הכי טובים כדי לחפש בו.
עד שיאהו הבינה את גודל הטעות, וניסתה לבנות מנוע חיפוש משלה דרך הרכישה של אינקטומי בסוף 2002 – גוגל כבר פתחה פער גדול בהובלה.
התקווה של גוגל בבינה מלאכותית
לסיפור הזה יש קווי דמיון ברורים לדינמיקה המתפתחת סביב AI: הקונצנזוס הנוכחי הוא שמודלי שפה גדולים הם קומודיטי, והמירוץ הוא לשלב אותם במוצר מנצח. איך תעריכו את הסיכויים של גוגל במירוץ כזה? בעוד שאני לא מצליח להיזכר במקרה אחד שבו גוגל ניצחה הודות לכך שהיה לה מוצר קונסיומר מלוטש יותר, אני יכול לחשוב על הרבה קטגוריות מוצר שבהן גוגל ניסתה — ונכשלה — להשיג בסיס משתמשים משמעותי. גוגל פלוס כנראה עדיין נותרת בתור הדוגמא המייצגת. (אני לא מנסה לפגוע באף אחד; באופן אישי עבדתי בעצמי על מוצרים שנכשלו-בלהשיג-בסיס-משתמשים-משמעותי במהלך השנים שלי בגוגל).
אבל כמה מוצרים של גוגל כן הצליחו בגדול: תחשבו על ג׳ימייל, שבדיוק חגג 21 שנים מאז השקת המוצר ב-1 באפריל 2004. זו נראתה כמו מתיחה מעולה; אין סיכוי שגוגל מציעה נפח אחסון בלתי מוגבל לתיבת האימייל שלכם בחינם. ג׳ימייל מעולם לא הציעה חוויית משתמש יוצאת דופן, אבל זה היה בסדר; המוצר ניצח הודות לתשתית בסקייל הגבוה העדיפה, ו flywheel של ביג דאטה (למשל ככל שיותר אימיילים עוברים דרך גוגל, כך משתפר סינון הספאם). אה, ודרך אגב - אחרי השקעה גבוהה על פני מספר שנים – גוגל סגרה את הניסיון שלה לבנות אפליקציית אימייל חדשנית יותר. ג׳ימייל אמנם השתפר, אבל הנקודה שלי היא שיכולת לבנות מוצרים עם חוויית משתמש ברמה גבוהה, מעולם לא הייתה היתרון היחסי של גוגל.
הספקטיות סביב AI וגוגל היא מובנת: בניגוד לשליטה המוחלטת של גוגל בחיפוש, ג׳מיני נתפסת בתור עוד אחד משורה של צ׳אטבוטים מבוססי AI. ולמה שאפליקציית ה AI של גוגל תצליח יותר מאשר אפליקציות הרשת החברתית או ההודעות או התשלומים או המוזיקה שלה?
מה אם יתברר, עם זאת, שהקונצנזוס הנוכחי הוא שגוי, ומודלי AI אינם קומודיטי? בדיוק כמו חיפוש בשנת 2000, ייתכן שטכנולוגיית AI יכולה להיעשות עד כדי כך טובה יותר – ומהירה יותר וזולה יותר – שיהיה אפשר לפתח יתרון טכנולוגי משמעותי ויציב? ייתכן שהתשובה היא לא, אבל התקווה הגדולה ביותר של גוגל בבינה מלאכותית – לפחות בכל מה שנוגע לקונסיומר – היא ש, שוב, ״הובלה טכנולוגית תתורגם בנקודה מסויימת לעסק רווחי״.
אסטרטגיית ה AI של גוגל דומה באופן מובהק לזו שעשתה את מנוע החיפוש כל כך מצליח: אינטגרציה הדוקה לאורך כל ה stack – מהחומרה לדאטה למודלים לתשתיות הענן לאפליקציות; הכל proprietary , מפותח (ועובר אופטימיזציה) על ידי גוגל. זה לא מבטיח הצלחה, אבל זה הסיכוי הכי טוב של גוגל למנף את היתרון היחסי שלה.
שאלת המפתח היא האם התשתית האינטגרטיבית של גוגל מובילה לעלויות inference נמוכות באופן משמעותי, מה שיצדיק מנטליות של ״AI הוא זול מדי״. מירוץ החימוש כבר בעיצומו ב AI, כשחברות טק גדולות ממהרות להשוות ולהעלות את ההוצאה של האחרות על GPU ודאטה סנטר. אם גוגל תיהנה מתשואה גבוהה יותר על הוצאה בכל מה שנוגע ללהגיב לשאילתות AI – בהשוואה ל OpenAI שמשתמשת במעבדי אנבידיה באמצעות התשתית של מיקרוסופט – אז גוגל צריכה להוציא כמה שהיא רק יכולה על הפצה של AI; יתרון עלויות משמעותי יגרום לזה ששחקנים אחרים יצטרכו להוציא הרבה יותר מגוגל רק כדי להישאר במשחק. ייתכן שזה כבר מתרחש, @sundarpichai פרסם באיקס (ב-1 באפריל, יום השנה ה-21 להשקה של ג׳ימייל):
ג׳מיני 2.5 זינק ישר לראש טבלאות הבנצ׳מארק (בינתיים לפחות). והוא זמין לכולם בחינם! אבל בעוד שאסטרטגיה דומה עבדה לטובתה של גוגל לפני 25 שנים, הזמן עוד יגיד האם לגוגל יהיה מזל גם במקרה הזה, או שפשוט נראה עוד מודלים תחרותיים מושקים בקרוב — בתמחור תחרותי — ע״י חברות AI אחרות. בעוד שזה עשוי לקחת זמן עד שהאבק יתפזר לגבי האם הימור על תשתית אינטגרטיבית שוב מוביל לטכנולוגיה עדיפה וייתרון יציב, זו התקווה הגדולה ביותר של גוגל; אז מוטב לה, כפי שסונדאר ניסח את זה: לתת לזה צ׳אנס!
כאן מסתיים תרגום הפוסט שתרגמתי באנגלית, ההמשך עוסק בעוד היבטים של אותו נושא -
בינה מלאכותית ומותם של הלינקים
בנדיקט אוונס כתב לאחרונה על הבעיה שהוא מכנה מותם של הלינקים והאינטרנט הפתוח; הטיעון המרכזי הוא ש LLMs מייצגים שינוי משמעותי של כללי המשחק. עד כמה שהתוכן באינטרנט כבר מזמן הפך לקומודיטי, פיסות התוכן עדיין נותרו יחידה אטומית שנוצרת על ידי בני אדם, ונצרכת בשלמותה על ידי בני אדם אחרים. אבל עכשיו זה משתנה:
כשזה מגיע לחיפוש באמצעות generative AI, התשובה פשוט מתקבלת – ללא לינקים – על בסיס כל מה שקיים באינטרנט. כל היחידות האטומיות של התוכן משתלבות ליצירת יחידה חדשה. תוכן ג׳נרטיבי, כפי שמטא כבר מדברת עליו, אומר שהפיד שלי באינסטגרם לא רק יראה לי תוכן שכנראה יעניין אותי, אלא גם ייצור דברים חדשים שאולי יעניינו אותי. האם זה משנה עבורי? [...]
עבור כל יוצר תוכן, החוזה היה שאנשים יכולים לגלות את התוכן שלכם בפלטפורמה, והפלטפורמה עושה כסף. אבל כדי להשלים עם זה, אנשים יגיעו אליכם (לינקים) או שהפלטפורמה תשלם לכם (יוטיוב), או גם וגם. תמיד היו כמובן תלונות על אלגוריתם החיפוש או גובה התשלום במסגרת הטרנזאקציה הזו, אבל תמיד הייתה תמורה כלשהי. אם, עכשיו, התוכן שלי הוא רק חומר גלם עבורכם כדי לייצר משהו חדש, שלא מתחבר אליי או משלם לי בכלל, אז למה אני משתתף בזה?
[...] אם אני יכול לקחת תמונה של חמישה רכיבים והטלפון שלי מציע מתכון, במקום לינק אליך, כמה ערך היה למתכון שלך מלכתחילה? אם העבודה שלי יכולה להיות מסונתזת לכדי תשובה גנרית וצפויה, האם זה היה שווה את זה? אם העסק שלך היה להגיד משהו שאנשים נטו לחפש או לקשר אליו, ולהיות מדורג גבוה או לקבל לינקים, ולעשות קצת כסף מפרסומות… ובכן, אף עסק ארביטראז׳ לא נמשך לנצח. כמו שטים או׳ריילי אומר, דאטה הוא לא נפט, דאטה הוא חול (ועכשיו מודלי שפה גדולים מייצרים הרבה יותר חול).
הזכרתי השבוע בטוויטר את הסיפור של יאן ואן דר קראבן: האתר שלו - World History Encyclopedia - הוא השני מבחינת טראפיק מבין אתרי ההיסטוריה באינטרנט. אבל הטראפיק שלו צנח ב 25% מאז שהתוכן שלו החל להופיע ב AI Overviews של גוגל. AI מנסח מחדש את המידע ומשלב תוכן מאתרי היסטוריה אחרים, בלי לינק (או תשלום) לאתר של ואן דר קראבן.
הלבטים שעומדים בפניו ממחישים את האופן שבו AI שובר את שיווי המשקל שהיה באינטרנט: הוא מנסח את זה כאילו היה מעין חוזה לא רשמי, שבו גוגל מאנדקסת ועושה מה שהיא רוצה עם התוכן שלכם – ומרוויחה מזה המון כסף – ובתמורה, שולחת קצת משתמשים לאתר שלכם, כדי שתהיה לכם הזדמנות גם לעשות להם מונטיזציה. אבל עכשיו החוזה הזה נשבר. הרבה אתרי חדשות חוסמים LLM crawlers בקובץ robots.txt1. אבל אז השאלה היא, איך משיגים טראפיק.
כשכתבתי על זה בטוויטר, חלק מהתגובות טענו שגוגל (וכמו כן OpenAI ואחרות) צריכות לשלם לבעלי האתרים האלה; אבל זה לא כל כך פשוט – קשה לדעת לאיזה מאלפי דפי האינטרנט שמציעים מתכון לעוגיות, מגיע תשלום בכל פעם שאתם מקבלים מתכון מצ׳אט ה AI שלכם. וקשה עוד יותר לפתח מודל כלכלי בר קיימא, שבו ישתלם לפרפלקסיטי או אנת׳רופיק לחלק תגמולים לכל מי שמעלה רשימת ״עשרה תרגילים יומיים לשיפור היציבה״.
שוב בנדיקט אוונס:
[...] אנשים התחילו לדבר על ״SEO עבור LLM״ – אם מישהו מבקש מ LLM המלצות בתחום שלכם, איפה האתר והמותג שלכם ידורג, ואיך תוכלו לשנות את זה? תציפו את האינטרנט בטקסט אודותכם? האם תוכלו להשתמש ב LLM כדי לג׳נרט את זה? … האינטרנט עשה את ההפצה חינמית, אבל לא את הגילוי, ועכשיו AI עושה את היצירה חינמית אבל הגילוי הפך להיות הרבה יותר קשה.
ואן דר קראבן, בינתיים, עבר להתמקד בתכנית מנויים בתשלום (עם מעל 2,000 משתמשים משלמים), וחושב על פורמטים אחרים שיהיו עמידים ל AI, כמו ספר או אפליקציה. ״אנחנו נוקטים בצעדים, אבל עם זאת, המודל העסקי שהיה לנו ב-15 השנים האחרונות – אני לא רוצה לומר נהרס – אבל הוא עומד בסימן שאלה. אז זה מלחיץ אותנו״.
צריך גם להכיר בזה שהרבה מהתוכן באינטרנט – מתכונים לעוגיות שמסתתרים בתחתית סיפור ארוך ולא מעניין על טיול לעיירה קטנה וחורפית, או כותרות כמו ״עשרה דברים שלא ידעתם על איך להישאר בריאים״ – הם תוצר לוואי של שיווי המשקל הנוכחי, וזה לא בהכרח דבר רע שייעלמו. מצד שני, לתוכן היסטורי כמו באנציקלופדיה של ואן דר קראבן כמובן שיש ערך ממשי, גם אם הרוב המוחלט של המשתמשים באינטרנט לא ירצו לשלם תמורתו, אחרי עשורים שבמהלכם התרגלו שתוכן כזה הוא חינמי. השאלה היא מה יהיה שיווי המשקל החדש שיווצר, איזה תבניות תוכן חדשות הוא יביא איתו, והאם יהיה מודל עסקי שיאפשר לאתרים כמו World History Encyclopedia להישאר פתוחים בחינם, ועדיין איכשהו לעשות כסף.
דברים קורים בטק
גוגל DeepMind מגבילה פרסומי מחקר במטרה לשמור על יתרון תחרותי ב AI. שישי סיאו, המנהלת הבכירה בגוגל שאחראית על פיתוח אפליקציית ה AI ג׳מיני, תעזוב את תפקידה ותוחלף ע״י ג׳וש וודוורד, מנהל גוגל לאבס שבין היתר היה אחראי על הפיתוח של NotebookLM. מאמר במגזין וויירד סוקר את מה שקרה בגוגל במהלך שנתיים של טירוף מאז ההשקה של ChatGPT.
OpenAI חצתה 20 מיליון מנויים משלמים, וצופה הכנסות של 12.7 מיליארד דולר השנה. החברה הכריזה על גיוס של 40 מיליארד דולר לפי שווי של 300 מיליארד.
ספר חדש חושף את הדרמה שמאחורי פיאסקו הפיטורים של סאם אלטמן בסוף 2023. חלק מתוכו, שפורסם בוול סטריט ג׳ורנל, מצביע על ניגודי עניינים בכך שסאם אלטמן לכאורה החזיק בעצמו בעלות על קרן הסטארטאפ של OpenAI, ולכאורה שיקר לחברי הדירקטוריון בנוגע לכך (פוסט של צבי מושושוויץ׳ ניתוח של מאט לוין)
OpenAI הכריזה על תמיכה ב MCP, סטנדרט פרוטוקול שפותח על ידי אנת׳רופיק כדי לאפשר לסוכני AI לתקשר עם סוגים שונים של תוכנה (כמו אובר או סיילספורס). מנכ״ל גוגל סונדאר פיצ׳אי גם צייץ בנושא. לשכבת ביניים עם ממשק סטנדרטי יש הרבה יתרונות, אבל בנדיקט אוונס כתב גם על שתי בעיות שיהיה קשה להתגבר עליהן: ראשית, כשמנסים ליצור אבסטרקציה מעל סוגי תוכנה שונים ומורכבים באמצעות שכבה אוניברסלית סטנדרטית, נוצרת בעיית ״המכנה המשותף הנמוך״ – שכבת הביניים לעולם לא תוכל לתמוך בכל הפיצ׳רים שמציעים הכלים שתחתיה. שנית, למה ש, למשל, אינסטהקארט, תרצה להפוך לקריאת API טיפש עבור חברת טריליון דולר של מישהו אחר? אינסטהקארט עושה את כל הרווח שלה מפרסום, אובר רוצה לעשות upsell למכונית יקרה יותר או תכנית מנוי, וסיילספורס רוצה שתשתמשו בכלי ה LLM החדשים שלה – הם לא רוצים שמישהו אחר ישלוט בחוויית המשתמש ויהיה הבעלים של הקשר עם הלקוח. (בלוג של בנדיקט אוונס, פוסט של סטיבן סינופסקי)
ההנפקה של CoreWeave, שירות ענן להשכרת מעבדים גרפיים, לא התרוממה, במה שניתן לפרש כאדישות או עצבנות של השוק לגבי תשתיות LLM (ניתוח של דאג או׳לופלין ניתוח של SemiAnalysis). ידיעה על כך שאנבידיה שוקלת לרכוש מתחרה של CoreWeave תמורת כמה מאות מיליוני דולרים.
מיקרוסופט מוסיפה יכולות reasoning ומחקר מעמיק לקו-פיילוט. אנת׳רופיק מפרסמת סטטיסטיקות לגבי שימוש בקלוד סונט 3.7. אדובי טוענים שטראפיק לאתרי אי-קומרס ממנועי AI זינק ב-1200%. רדיט מוסיפה תרגום מבוסס AI ברחבי האתר שלה, ומשיגה בכך נתח גדול יותר של טראפיק מגוגל.
ריאיון עם מנכ״ל דורדאש טוני צ׳ו על הימים המוקדמים של החברה. ריאיון עם טד סאראנדוס, מנכ״ל שותף של נטפליקס, על הניצחון בסטרימינג.
אילון מאסק ממזג את איקס (לשעבר טוויטר) לתוך xAI, חברת ה LLM שלו, ובכך קונה החוצה את המשקיעים שעזרו לו לרכוש את טוויטר, ומגדיל את אחוזי הבעלות שלו ב xAI. (ניתוח של מאט לוין) DOGE מתכננים לכתוב מחדש את המערכות הישנות והסבוכות של הסושיאל סקיוריטי האמריקאי, שכתובות בשפת קובול, בתוך חודשים בודדים באמצעות AI. נשיא ארה״ב דונאלד טראמפ הכריז על מכסי ייבוא בגובה של 10% לפחות בהתאם למדינה. מארק צוקרברג ניסה לשכנע את טראמפ לסייע בהחלטה של האיחוד האירופי. אפל ואילון מאסק מתנגשים על רקע שירותי טלפון בלוויין. סופטבנק מגייסת חוב בגובה 16.5 מיליארד דולר להשקעה בפרוייקטים בארה״ב. שיאומי, אחת מיצרניות האנדרואיד המובילות, מגייסת 5.5 מיליארד דולר כדי לייצר מכוניות.
משפחת טראמפ מקדמת את ההימור שלה על קריפטו עם השקעה בחברת מיינינג לביטקוין. ״בפינה החשוכה של קריפטו״, התאבדות הופכת ל Meme Coin. ניוזמקס הופכת ל Meme Stock ושווה יותר מפוקס ניוז לאחר שהמניה שלה זינקה בהנפקה.
הנשיא דונאלד טראמפ הקל את העונש של קרלוס ווטסון וחנן את טרבור מילטון. ווטסון ניהל את אוזי מדיה, שהתחזתה ללקוח בשיחת דיו דיליג׳נס; מילטון ניהל את חברת ניקולה, שדרדרה משאית במורד הגבעה והעמידה פנים שהיה שם מנוע שנוהג באופן עצמאי.
צ׳ארלי ג׳אוויס נמצאה אשמה בהונאה של ג׳יי פי מורגן צ׳ייס (על הסיפור המלא דיברנו במהדורה 13). מאט לוין העיר שההונאה המשעשעת של ג׳אוויס כללה מכירת רשימה של כתובות אימייל מזוייפות תמורת 175 מיליון דולר, ושאולי יש לה תקווה, כי טראמפ בסך הכל עדיין לא הגיעה לחון גם אותה, במסגרת הטרנד הכללי שלוין מפרש בתור, ״אם אתם עושים הונאות מצחיקות בפרופיל גבוה, דונלד טראמפ ימצא את זה משעשע וייתן לכם חנינה״. יש גם פרשנויות אחרות.
״זה בדיוק, בדיוק, בדיוק מה שחוקי ניירות ערך נועדו למנוע. ועכשיו הם לא קיימים יותר! נו טוב.״
תודה שקראתם את הרהורי יום שישי שלי השבוע!
אתם מוזמנים גם לעקוב אחריי בלינקדאין, וואטסאפ, טוויטר או פייסבוק. ואם עדיין לא נרשמתם לבלוג - אפשר לעשות את זה כאן כדי לקבל את הניוזלטר בכל יום שישי בבוקר ישירות למייל:
תזכורת: הבלוג הזה הוא למטרות לימודיות בלבד. הכותב עשוי להחזיק פוזיציות במניות שהוזכרו. אין לראות באמור לעיל ייעוץ השקעות. מסחר במניות מלווה בסיכונים רבים. אנא קראו את הדיסקליימר המלא כאן.
לקובץ מהסוג הזה אין תוקף חוקי, זה יותר עניין של אתיקת אינטרנט, מה שיצר סערה בשנה שעברה כשפרפלקסיטי לכאורה התעלמה מקבצי robots.txt.
כרגיל, הנאה צרופה. :)
חופש נעים, מחכה שתחזור...
מצוין כרגיל. תודה!
אגב בשבועות שאתה לוקח חופש יהיה תרגיל מעניין לבקש מאחד ממנועי
AI
או מכולם לייצר מהדורות:
1. הירהורי יום שישי שלהמנוע הרלוונטי בהתבסס על כל מה שכתבת עד עכשיו נראה עד כמה רחוק היום שנוכל לקבל מהדורה מג׳ונרטת
2. לקט הירהורי יום שישי בהתבסס על הקטעים הטובים ביותר לפי דעתו של המנוע
לדעתי זה תרגיל מעניין -- לא אמור גם לקחת הרבה זמן לייצר
מה אתה אומר?