מהי בינה מלאכותית?
מאז ומתמיד בני אדם ניסו להבין מהי תבונה אנושית ומה מבדיל אותם מהחיות או מהמכונות. כבר בעת העתיקה נולדו שאלות על מהות החשיבה, על הקשר בין שכל לנפש, ועל האופן שבו ניתן להסביר תהליכי קבלת החלטות. לאורך מאות שנים רעיונות אלה נותרו בגדר פילוסופיה ותיאוריה בלבד, אך עם המצאת המחשבים במאה העשרים הפכה השאלה לפתע לשאלה מעשית. האם ניתן לבנות מכונה שתחשוב? האם אפשר ליצור ישות מלאכותית שתבצע לא רק חישובים מתמטיים אלא גם תסיק מסקנות, תלמד, ואולי אפילו תיצור רעיונות חדשים?
המונח "בינה מלאכותית" Artificial Intelligence נטבע רשמית בכנס דארטמות’ בשנת 1956, אולם השורשים של התחום נטועים הרבה קודם. פילוסופים כמו René Descartes (1596–1650) דיברו על ההבחנה בין גוף לנפש, מתמטיקאים כמו Gottfried Wilhelm Leibniz (1646–1716) חלמו על שפה אוניברסלית לחישוב טענות, ומדענים כמו George Boole (1815–1864) פיתחו מערכות לוגיות שניתן ליישמן בעזרת מכונות. כל אלה סיפקו בסיס אינטלקטואלי שהפך את הבינה המלאכותית ממחשבה תיאורטית למאמץ טכנולוגי.
המהפכה המחשובית של המאה העשרים שינתה את ההגדרה של אינטליגנציה. במקום לראות אותה כיכולת אנושית ייחודית בלבד, התגבשה ההבנה כי ניתן לנסח את האינטליגנציה כחישוב. מכונות יכלו לבצע פעולות שבעבר נחשבו נחלת האדם בלבד: זיהוי תבניות, פתרון בעיות מתמטיות מורכבות, או אפילו שיחה בסיסית בשפה טבעית. עם כל הצלחה נולד גם ספק חדש: האם מדובר באינטליגנציה אמיתית, או רק בהדמיה חכמה?
במהלך שבעים השנים האחרונות חוותה הבינה המלאכותית גלים של אופטימיות גדולה ושל אכזבות עמוקות. תקופות של השקעה אדירה והצהרות על פריצות דרך התחלפו בזמנים של "חורף AI" שבהם התקציבים נחתכו והאמון הציבורי ירד. כיום, עם הופעת מודלים עצומים מבוססי רשתות עצביות וטרנספורמרים כמו GPT, נראה כי אנו שוב בעיצומה של תקופה של פריחה טכנולוגית ורעיונית. השאלה הגדולה שנותרה פתוחה היא האם הפעם הצלחנו לייצר לא רק כלי חזק, אלא אולי צורה חדשה של תבונה.
מקורות
- Britannica, “Artificial Intelligence.” URL: https://www.britannica.com/technology/artificial-intelligence
- Stanford Encyclopedia of Philosophy, “Philosophy of Artificial Intelligence.” URL: https://plato.stanford.edu/entries/artificial-intelligence
- McCorduck, Pamela. Machines Who Think. A.K. Peters, 2004.
קדם־היסטוריה לוגיקה אוטומטונים ופילוסופיה
כדי להבין את הבסיס של הבינה המלאכותית עלינו לשוב אל יוון הקלאסית. הפילוסוף אריסטו (Aristotle, 384–322 BCE) היה מהראשונים שניסחו שיטה לוגית מסודרת: הסילוגיזם. הוא טען כי ניתן להסיק מסקנה הכרחית אם מקבלים שתי הנחות נכונות. למשל, אם כל בני האדם בני תמותה ואם סוקרטס הוא אדם, הרי שסוקרטס בן תמותה. למרות פשטותו, זהו אחד הצעדים הראשונים בהיסטוריה של החשיבה הפורמלית שהשפיעה ישירות על בניית מחשבים ולימים על אלגוריתמים של בינה מלאכותית.
בימי הביניים ניסה רמון לול (Ramon Llull, 1232–1316) מיו דה מיורקה לפתח מכשיר לוגי שיקרא "Ars Magna". בעזרת דיסקים מסתובבים ניתן היה להרכיב טענות מורכבות מתוך שילוב של סמלים. לול ראה במכשירו כלי מיסיונרי להבנת האמת הדתית, אך בדיעבד אפשר לראות בו ניסיון מוקדם להמיר מחשבה אנושית בתהליך מכני.
במאה השבע עשרה הופיעו דמויות מכריעות נוספות. רנה דקארט (René Descartes, 1596–1650) העלה את רעיון ה"מכונה החיה" וטען כי גופים של חיות פועלים כמו אוטומטון מכני. גוטפריד וילהלם לייבניץ (Gottfried Wilhelm Leibniz, 1646–1716) הרחיק לכת והציע כי ניתן לנסח שפה אוניברסלית, Calculus Ratiocinator, שתאפשר לפתור כל מחלוקת אנושית באמצעות חישוב בלבד. חלום זה, שאנשים ישבו מול מחשב ויכתבו טיעונים לוגיים כדי לפתור ויכוחים, הוא נבואה מוקדמת ל־AI.
במאה ה־18 וה־19 הופיעו אוטומטונים מכניים מתוחכמים שנבנו בחצרות אירופה. שעוני קוקיה, פסנתרי נגינה אוטומטיים, ובובות־סופרות שיכלו לכתוב משפטים בסיסיים. הם לא היו תבוניים באמת, אך הציבור ראה בהם פלא טכנולוגי. השפעתם ניכרה בספרות: מרי שלי (Mary Shelley, 1797–1851) כתבה את "פרנקנשטיין" ב־1818 כסיפור על יצירה מלאכותית שתפקידה לחקות את החיים. ההדים של אוטומטונים אלה מצביעים על כך שהחברה הייתה מוכנה נפשית לרעיון של יצורים מלאכותיים.
במאה ה־19 המשיך ג'ורג' בול (George Boole, 1815–1864) עם אלגברה לוגית, וצ'ארלס בבג' (Charles Babbage, 1791–1871) יחד עם אדה לאבלייס (Ada Lovelace, 1815–1852) תכננו את מכונת החישוב האנליטית. בבג' ולבלייס הניחו את הבסיס התיאורטי של מדעי המחשב: המכונה כישורת חישוב כללית, והרעיון של תכנות באמצעות הוראות. לאבלייס אפילו טענה כי בעתיד מכונה תוכל לכתוב מוזיקה – רעיון שבמאה ה־21 מתממש עם AI גנרטיבי.
מקורות
- Britannica, “Gottfried Wilhelm Leibniz.” URL: https://www.britannica.com/biography/Gottfried-Wilhelm-Leibniz
- Stanford Encyclopedia of Philosophy, “Leibniz’s Philosophy of Logic.” URL: https://plato.stanford.edu/entries/leibniz-logic
- Britannica, “George Boole.” URL: https://www.britannica.com/biography/George-Boole
- Britannica, “Ada Lovelace.” URL: https://www.britannica.com/biography/Ada-Lovelace
אלן טיורינג והנחת היסודות של עידן המחשב והבינה המלאכותית
כאשר אנו מחפשים דמות אחת שניתן לומר עליה כי היא פתחה את עידן המחשב והבינה המלאכותית, אי אפשר שלא להזכיר את אלן מייתיסון טיורינג (Alan Mathison Turing, 1912–1954). סיפור חייו של טיורינג הוא שילוב נדיר בין תובנות מתמטיות עמוקות, תרומה צבאית שהצילה עמים שלמים, ורדיפה אישית טרגית שהפכה אותו לסמל של גאונות מבריקה שלא זכתה להכרה מלאה בחייו.
טיורינג נולד בלונדון ביוני 1912 למשפחה ממעמד בינוני. כבר בילדותו התגלה כבעל חשיבה חריגה: הוא פתר בעיות מתמטיות בעצמו, המציא דרכים מקוריות לחישוב, והראה התעניינות עצומה במדע. בנערותו התקבל לבית הספר היוקרתי שרבורן, אך שם נחשב לילד "שונה", מרוכז בעולם הפנימי שלו יותר מאשר בנורמות החברתיות. למרות זאת, המורים הבחינו ביכולותיו המיוחדות, והוא התקדם במהירות לעבר אוניברסיטת קיימברידג'.
בשנות ה־30 עמד העולם האקדמי מול שאלת ה־Entscheidungsproblem שהציב דוד הילברט (David Hilbert, 1862–1943): האם קיימת שיטה כללית שמאפשרת להכריע בכל שאלה מתמטית אם היא נכונה או שגויה? טיורינג, בעבודתו המפורסמת משנת 1936, “On Computable Numbers, with an Application to the Entscheidungsproblem”, נתן תשובה מהפכנית. הוא הציג מודל מופשט של "מכונת טיורינג": מכונה עם סרט אינסופי שעליו רשומים סמלים, וראש קריאה־כתיבה שמבצע פעולות פשוטות לפי סדר חוקים. בעזרת מודל זה הראה כי יש בעיות מתמטיות שלא ניתן להכריע לגביהן באופן אלגוריתמי.
המאמר הזה לא רק סיים את הוויכוח המתמטי של זמנו, אלא גם הציע רעיון מרעיש: ניתן להגדיר מכונה אוניברסלית שיכולה לדמות כל מכונה אחרת. רעיון זה הוא לב־ליבו של המחשב המודרני. כל מחשב כיום, מהמחשב הנייד ועד לסמארטפון, הוא למעשה מכונת טיורינג אוניברסלית: הוא לא נבנה מראש כדי לבצע משימה אחת, אלא מסוגל להריץ כל תוכנה שנכתבת עבורו.
מלבד תרומתו התיאורטית, טיורינג התפרסם בזכות פעילותו במלחמת העולם השנייה. במרכז בלטצ'לי פארק (Bletchley Park) שבבריטניה הוביל צוות שעסק בפיצוח הצפנים של מכונת האניגמה הנאצית. בעזרת מכונה מכנית־חשמלית שפותחה על בסיס עקרונותיו, ה־“Bombe”, הצליחו הוא וחבריו לחשוף את התקשורת הסודית של הגרמנים. היסטוריונים מעריכים כי הצלחתו קיצרה את המלחמה באירופה בשלוש עד ארבע שנים והצילה מיליוני חיים. אך בשל חיסיון ביטחוני, הציבור לא ידע על תרומתו עד עשרות שנים מאוחר יותר.
לאחר המלחמה, טיורינג לא נח. הוא עבד במעבדות הלאומיות הבריטיות על תכנון מחשבים אלקטרוניים ראשונים, ביניהם פרויקט ACE (Automatic Computing Engine). כאן ניסה ליישם הלכה למעשה את רעיונותיו התיאורטיים על מכונה אוניברסלית. נוסף לכך, החל לעסוק בשאלה חדשה: האם אפשר לגרום למכונה לא רק לחשב, אלא גם "לחשוב"?
ב־1950 פרסם את המאמר “Computing Machinery and Intelligence” שבו הציע את "מבחן טיורינג". במקום לשאול “האם מכונות חושבות?”, שאלה פילוסופית שקשה להגדיר, הוא הציע ניסוי פשוט: אם אדם לא יכול להבדיל בשיחה טקסטואלית בין מכונה לאדם, יש לומר כי המכונה מפגינה אינטליגנציה. רעיון זה הפך לאבן יסוד בדיונים על בינה מלאכותית עד ימינו.
למרות גאונותו, חייו האישיים היו רצופי סבל. טיורינג היה הומוסקסואל בתקופה שבה יחסים חד־מיניים נחשבו לעבירה פלילית בבריטניה. בשנת 1952 הורשע ב"מעשה מגונה" ונאלץ לבחור בין מאסר לטיפול הורמונלי אכזרי. הוא בחר באפשרות השנייה, שסימנה אותו חברתית וריסקה את בריאותו. ב־1954 נמצא מת בביתו, כתוצאה מהרעלה בציאניד. במשך שנים סברו שהתאבד, אם כי חלק מהחוקרים טוענים שהייתה זו תאונה. רק ב־2009 התנצל ראש ממשלת בריטניה גורדון בראון בשם האומה על היחס המשפיל שזכה לו, וב־2013 העניקה לו המלכה אליזבת חנינה רשמית.
טיורינג נותר עד היום דמות מיתית במדעי המחשב. שמו חרוט על פרסי מדע, על פסלים, ועל אינספור ספרים ומאמרים. רעיונותיו מלווים כל מחשב וכל מערכת בינה מלאכותית – מהמחשבים הראשונים של שנות ה־40 ועד למודלים עצומים של המאה ה־21. קשה לחשוב על דמות אחת אחרת שהשפעתה על עידן הדיגיטל הייתה כה עמוקה ורחבה.
מקורות
- Alan Turing, “On Computable Numbers, with an Application to the Entscheidungsproblem” (1936). Proceedings of the London Mathematical Society.
URL: https://academic.oup.com/plms/article/s2-42/1/230/1557763 - Alan Turing, “Computing Machinery and Intelligence” (1950). Mind, 59(236): 433–460.
URL: https://academic.oup.com/mind/article/LIX/236/433/986238 - Britannica, “Alan Turing.”
URL: https://www.britannica.com/biography/Alan-Turing - Hodges, Andrew. Alan Turing: The Enigma. Princeton University Press, 2014.
URL: https://press.princeton.edu/books/paperback/9780691164724/alan-turing-the-enigma
הכנס שבו המציאו עתיד: דארטמות’ 1956 והרגע שבו נולדה “בינה מלאכותית”
בקיץ 1956 התכנסו באוניברסיטת דארטמות’ שבניו־המפשייר קבוצה קטנה של מדענים צעירים. לא היה להם מימון גדול, לא היה ציוד מרשים, וגם לא פרסום בעיתונים. אך מה שהיה להם הוא רעיון – רעיון כה נועז, עד שכמעט לא ניתן היה להאמין שמישהו מעלה אותו ברצינות: אפשר לבנות מכונה שתהיה “אינטליגנטית”. כאן, בכנס זעיר שנמשך שבועות ספורים, נולד לראשונה המונח Artificial Intelligence, ובו נשתלו הזרעים שהצמיחו את כל מה שאנו מכנים היום AI.
מי עמד מאחורי הכנס הזה? בראש ובראשונה ג’ון מקארתי (John McCarthy, 1927–2011), מתמטיקאי מוכשר מאוניברסיטת דארטמות’, שעתיד להיקרא “אבי הבינה המלאכותית”. יחד איתו הגיעו קלוד שנון (Claude Shannon, 1916–2001), “אבי תורת המידע”, מרווין מינסקי (Marvin Minsky, 1927–2016), ונתניאל רוצ’סטר (Nathaniel Rochester, 1919–2001) מ־IBM. שמות שאז לא היו ידועים לציבור הרחב, אך השפעתם על התרבות האנושית תהיה עצומה.
בהצעת המחקר שלהם נכתב משפט שזעזע את החשיבה המדעית: “כל היבט של למידה או כל תכונה אחרת של אינטליגנציה עקרונית ניתנים לתיאור כה מדויק עד שמכונה תוכל לדמות אותם.” לא עוד מחשב שמחשב מספרים בלבד, אלא מכונה שתחשוב, תתכנן, תדבר, תבין – ממש כמו אדם. הצהרה זו הייתה יותר מתוכנית מחקר, היא הייתה חזון פילוסופי נועז על עתידו של המין האנושי.
בכנס הוצגו ניסיונות ראשונים ליישם את החזון. תוכניות משחקי דמקה ושחמט, מערכות חישוביות לניסוח לוגי, וניסיונות להסביר כיצד מכונה יכולה ללמוד. היה זה צעד ראשון ומגושם, אך הוא סלל דרך. המשתתפים חזרו לבתיהם נרגשים, מלאי רעיונות, וכל אחד מהם יצא למסע אישי שיתרום בהמשך לעולם: מקארתי ימציא את שפת LISP, מינסקי יפתח מעבדות AI ב־MIT, ושנון יעצב את הבסיס התאורטי לכל מערכות התקשורת המודרניות.
חשוב להבין עד כמה זה היה מהפכני. ב־1956 מחשבים תפסו חדרים שלמים, פעלו באמצעות כרטיסי ניקוב, והיו מסוגלים לבצע בעיקר חישובים מתמטיים בסיסיים. להעז ולומר כי אותם מחשבים יוכלו “לחשוב” – היה זה הימור אינטלקטואלי מסעיר, כמעט שיווקי באופיו. בכך יש קסם מיוחד לאנשי שיווק ויזמות: גם בעולם העסקי, רעיונות גדולים מתחילים פעמים רבות מהצהרה שנראית מופרכת – ואז הופכים למציאות.
הכנס בדארטמות’ לא פתר בעיות טכניות, אך הוא עשה דבר חשוב בהרבה: הוא נתן שם. מהרגע שהמונח Artificial Intelligence נטבע, נולדה גם קהילה מדעית, חזון משותף, ותעשייה עתידית. זה היה אירוע שבו לא רק המציאו תחום, אלא גם שכנעו דור שלם של מדענים ומשקיעים שעתיד שונה לגמרי מחכה מעבר לפינה.
מקורות
- McCarthy, John; Minsky, Marvin; Rochester, Nathaniel; Shannon, Claude. “A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence” (1955).
URL: http://jmc.stanford.edu/articles/dartmouth/dartmouth.pdf - Britannica, “Artificial Intelligence – The Dartmouth Conference.”
URL: https://www.britannica.com/technology/artificial-intelligence/The-Dartmouth-Conference - Nilsson, Nils J. The Quest for Artificial Intelligence: A History of Ideas and Achievements. Cambridge University Press, 2010.
URL: https://www.cambridge.org/core/books/quest-for-artificial-intelligence/357CA7C4523D6E41D34A81F7A2B391E1
העידן הסימבולי: חוקים, לוגיקה, ורובוטים ראשונים בעולם של כרטיסי ניקוב
לאחר כנס דארטמות’ של 1956 החלה להתגבש צורה ברורה של מחקר בבינה מלאכותית. שנות ה־60 וה־70 נחשבות לתקופת ה־Symbolic AI – בינה מלאכותית סימבולית – שבה האמונה המרכזית הייתה שאינטליגנציה אנושית נובעת בעיקרה מתהליכי חשיבה לוגיים. אם נצליח לנסח את חוקי החשיבה במערכת של כללים ברורים, נוכל ללמד מחשב “לחשוב” כמונו.
כדי להבין את התקופה צריך להיכנס לרגע אל חיי היומיום. מחשבים אז לא היו בכיס של כל אחד. הם היו תופסים חדרים עצומים, מצוידים בנורות מהבהבות, קונסולות מלאות מתגים, וכרטיסי ניקוב. סטודנטים באוניברסיטאות ניגשו עם ערימות של כרטיסים מחוררים, מחכים שעות עד שהתור יגיע כדי להריץ תוכנית קצרה. מחשב אישי כלל לא היה קיים. רק ב־1977 ייצא לשוק ה־Apple II, אחד הראשונים שיהפכו את המחשב למוצר צרכני.
במרחב התרבותי ניכרה התרגשות: סדרות טלוויזיה כמו “מסע בין כוכבים” (Star Trek) בשנות ה־60 הציגו מחשבים שמדברים בקול נינוח, ספרי מדע בדיוני מאת אייזק אסימוב (Isaac Asimov, 1920–1992) ניסחו את “חוקי הרובוטיקה”, והציבור החל לדמיין עתיד שבו מכונות לא רק מחשבות אלא גם שותפות מלאות לחברה האנושית.
במציאות המדעית, שני פרויקטים בולטים הגדירו את התקופה. הראשון היה ELIZA, תוכנת מחשב שפיתח ג’וזף וייזנבאום (Joseph Weizenbaum, 1923–2008) ב־1966 ב־MIT. ELIZA סימלה את הכוח והאשליה של בינה מלאכותית. היא נבנתה כצ’ט־בוט פרימיטיבי שהתחזה לפסיכותרפיסטית בסגנון רוג’ריאני: המשתמש כתב משפטים, והיא החזירה שאלות כלליות כמו “מדוע אתה אומר זאת?” או “איך אתה מרגיש לגבי זה?”. על אף הפשטות, אנשים רבים הרגישו שהם משוחחים עם ישות מבינה. חלק מהסטודנטים במעבדה סירבו להאמין שזו רק תוכנה.
הפרויקט השני היה Shakey the Robot, שנבנה בסוף שנות ה־60 במכון המחקר של סטנפורד (SRI). Shakey היה הרובוט הראשון שידע לא רק לנוע, אלא גם לתכנן מסלול ולבצע פעולות בהתאם לחוקים לוגיים. היו לו מצלמות פשוטות, והוא הצליח להתמצא בחדרים בסיסיים, להזיז קוביות, ולעקוף מכשולים. בהשוואה לרובוטים תעשייתיים של התקופה, שעבדו רק לפי פקודות קבועות מראש, Shakey סימל חלום חדש: מכונה עצמאית שמבינה את סביבתה.
תרבותית, שנות ה־60 וה־70 היו שנים של תקווה טכנולוגית אדירה. טיסת הירח של אפולו ב־1969 סימנה את שיא האמונה בכוחה של הנדסה לוגית ותכנון מתמטי. בתוך האווירה הזו, גם בינה מלאכותית נתפסה כהמשך טבעי להתקדמות המדע. עם זאת, האשליה לא החזיקה מעמד זמן רב. ככל שהמערכות גדלו, ניכר שקשה מאוד לנסח חוקים לכל מצב אפשרי. שיחה יומיומית, למשל, כוללת אינסוף ניואנסים שלא ניתן לתכנת בכמה כללים פשוטים.
הבינה המלאכותית הסימבולית אכן פתחה את הדרך – היא נתנה לנו את המושג “מערכת מומחה”, את הדמיון הראשון לשיחה עם מחשב, ואת הרובוט העצמאי הראשון. אך היא גם חשפה את המגבלות: העולם מורכב מדי כדי לצמצם אותו לחוקים קשיחים. זוהי הבנה שעתידה להוביל לגל הבא – למידה מתוך נתונים.
מקורות
- Weizenbaum, Joseph. ELIZA – A Computer Program For the Study of Natural Language Communication Between Man and Machine (1966). MIT.
URL: https://dl.acm.org/doi/10.1145/365153.365168 - Nils J. Nilsson. Shakey the Robot (Technical Note 323, 1984). SRI International.
URL: https://www.ai.sri.com/shakey/ - Asimov, Isaac. I, Robot (1950). Gnome Press.
URL: https://archive.org/details/IRobot-Asimov - Britannica, “Artificial Intelligence – Symbolic Approaches.”
URL: https://www.britannica.com/technology/artificial-intelligence/Symbolic-AI
הפרספטון: בין חלום מהפכני לחורף הראשון של הבינה המלאכותית
בסוף שנות ה־50 ותחילת שנות ה־60 נדמה היה שהמדע מצא את המפתח לאינטליגנציה מלאכותית אמיתית. פרנק רוזנבלט (Frank Rosenblatt, 1928–1971), פסיכולוג ומהנדס אמריקאי, פיתח את הפרספטון (Perceptron) – מודל מתמטי של רשת עצבית מלאכותית שנועד לחקות את אופן פעולתם של תאי העצב במוח. החזון היה מסחרר: מחשבים שיוכלו ללמוד מהניסיון, להכליל מתוך דוגמאות, ואפילו "לחשוב" ללא צורך בחוקים מפורשים.
ב־1958 הדגים רוזנבלט את הפרספטון לציבור. העיתונות עטה על ההמצאה. כותרות בעיתונים הכריזו כי נבנה מחשב שילמד לראות ולזהות דימויים, ושבעתיד הוא "יצעד, ידבר, יכתוב, ויבין". חיל הים האמריקאי מימן את המחקר, והוצגה מכונה גדולה שנראתה עתידנית. בשיח התרבותי של התקופה – שנות המלחמה הקרה, מירוץ החלל, והאמונה בכוחם של מדענים – הפרספטון נתפס כהבטחה אדירה שתחולל מהפכה לא רק במדע, אלא גם בחיי היומיום. אנשים דמיינו עולם שבו מחשבים יזהו פנים, ינהלו שיחות, ואולי אפילו ילמדו כמו ילדים.
אך המציאות הייתה מורכבת בהרבה. הפרספטון, במתכונתו הראשונית, היה רשת בעלת שכבה אחת בלבד. הוא ידע להבחין בין דפוסים פשוטים (למשל לזהות נקודות שחורות על רקע לבן), אך נכשל במשימות מעט מורכבות יותר. את נקודת השבר סימנו מרווין מינסקי (Marvin Minsky, 1927–2016) וסיימור פפרט (Seymour Papert, 1928–2016), שני חוקרי MIT, שפרסמו בשנת 1969 את ספרם Perceptrons. בספר זה הראו כי פרספטון חד־שכבתי אינו מסוגל לפתור בעיות בסיסיות של לוגיקה, כמו פונקציית XOR. מסקנתם הייתה חדה: הפרספטון מוגבל מאוד, ותקוות התבונה הלומדת רחוקות מלהתגשם.
הביקורת החריפה יצרה אפקט מצנן עצום. מימון המחקר ברשתות עצביות כמעט נעלם, והקהילה המדעית העבירה את תשומת הלב למערכות מבוססות כללים לוגיים, שהיו באותם ימים בשליטה. הציבור, שעד אז קרא בעיתונים על מכונות לומדות, איבד אמון. התקופה שנולדה מכך נקראה לימים “החורף הראשון של ה־AI” – תקופה שבה חלומות גדולים התרסקו אל מול המציאות המעשית.
חיי היומיום של אותם ימים נשארו רחוקים מאוד מהחזון. מחשבים עדיין נראו כארונות מתכת ענקיים, ממוקמים באוניברסיטאות ומוסדות ממשלתיים, ולא שינו את חיי האדם הפשוט. אבל במעבדה נזרעו זרעים שיחזרו לפרוח רק כעבור שני עשורים: ההבנה שרשתות עצביות אכן מסוגלות ללמוד, אם רק יימצאו הדרך המתמטית והעוצמה החישובית הדרושה להן.
הסיפור של הפרספטון הוא סיפור על פער בין חזון למציאות. הוא ממחיש כיצד תרבות של אופטימיות טכנולוגית יכולה להוליד ציפיות עצומות, אך גם כיצד ביקורת מדעית חריפה יכולה לקבור תחום שלם לעשורים. יחד עם זאת, בלי הכישלון של הפרספטון לא הייתה נוצרת הקרקע לתחייה המחודשת של רשתות עצביות בשנות ה־80 וה־90.
מקורות
- Rosenblatt, Frank. “The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain.” Psychological Review, 65(6): 386–408, 1958.
URL: https://psycnet.apa.org/doi/10.1037/h0042519 - Minsky, Marvin; Papert, Seymour. Perceptrons: An Introduction to Computational Geometry. MIT Press, 1969.
URL: https://mitpress.mit.edu/9780262630221/perceptrons - Britannica, “Artificial Intelligence – Neural Networks.”
URL: https://www.britannica.com/technology/artificial-intelligence/Neural-networks - Nilsson, Nils J. The Quest for Artificial Intelligence: A History of Ideas and Achievements. Cambridge University Press, 2010.
URL: https://www.cambridge.org/core/books/quest-for-artificial-intelligence/357CA7C4523D6E41D34A81F7A2B391E1
“ידע הוא כוח”: מערכות מומחה והחלום להכניס את החכמה למחשב
אחרי האכזבה הגדולה מהפרספטון בסוף שנות ה־60, הקהילה המדעית לא נטשה את חלום הבינה המלאכותית. במקום רשתות עצביות, שהתגלו כמוגבלות טכנית, המוקד עבר לרעיון אחר: אם מחשב אינו יודע “ללמוד” לבד, אולי ניתן להזין לתוכו את הידע שכבר קיים אצל בני אדם – מדענים, רופאים, מהנדסים – וללמד אותו לפעול כמו מומחה. כך נולדו מערכות מומחה (Expert Systems).
מערכת מומחה נבנתה משני חלקים עיקריים: בסיס ידע שכלל חוקים ועובדות שנאספו מאנשי מקצוע, ו־מנוע הסקה (Inference Engine) שהיה מסוגל להשתמש בכללים הללו כדי להגיע למסקנות חדשות. למשל, אם הכלל אומר: “אם החולה סובל מחום גבוה ושיעול, ייתכן שמדובר בזיהום ריאתי”, המחשב יכול לקלוט נתונים מהמשתמש ולהחזיר אבחנה.
הדוגמה המפורסמת ביותר: MYCIN
בשנת 1972 פותחה באוניברסיטת סטנפורד מערכת בשם MYCIN. מטרתה הייתה לסייע לרופאים לאבחן מחלות זיהומיות ולתת המלצות לטיפול אנטיביוטי. המערכת כללה מאות כללים שנכתבו בשיתוף עם רופאים מומחים. כאשר רופא הזין נתונים על חולה, המחשב חזר אליו עם אבחנה אפשרית והסבר של הנימוקים שהובילו למסקנה.
עבור רופאים רבים זו הייתה חוויה מדהימה: מחשב שמדבר “כמו מומחה”, ואף נותן נימוקים כמו “מכיוון שנצפתה חום גבוה ונמצאה חיידקיות בדם, קיימת סבירות גבוהה לזיהום סטפילוקוקי”. מצד שני, היו גם הסתייגויות: הרופאים לא סמכו תמיד על המלצות המחשב, במיוחד כשהיו מנוגדות לאינטואיציה המקצועית שלהם.
חיי היומיום באותה תקופה
חשוב להבין את הרקע: שנות ה־70 וה־80 היו שנים של מחשבים ענקיים במוסדות אקדמיים וחברות גדולות, לצד תחילת הופעתם של מחשבים אישיים. עובדים במשרדים עדיין השתמשו במכונות כתיבה, טלפונים חוגה, וארונות מתכת מלאי קלסרים. מחשב נחשב כלי יוקרתי, יקר, ורחוק מהבית הממוצע. בתוך עולם כזה, המחשבה שיש "מערכת מומחה" שיודעת יותר מכל עובד – הייתה כמעט מהפכנית.
בתעשייה, מערכות מומחה נבנו עבור חברות כימיה, הנדסה, ותכנון. IBM, למשל, פיתחה מערכות לסיוע בתכנון מעגלים אלקטרוניים. החברות ראו בכך כלי אסטרטגי: שימור ידע של מומחים ותיקים בתוך המחשב, כך שגם כשעובדים פורשים, הידע לא הולך לאיבוד.
התרבות והדמיון
בעולם התרבות, שנות ה־80 היו תקופה שבה המחשבים החלו לחדור לקולנוע ולספרות כסמלים של עתיד מלהיב אך גם מאיים. סרטים כמו “טרון” (Tron, 1982) ו־“וור גיימס” (WarGames, 1983) הציגו בני נוער המשתמשים במחשבים כדי לפרוץ לעולמות אחרים – מדמיוניים ועד צבאיים. הציבור התחיל להכיר במחשב כישות עם כוח, ולעיתים כישות שיכולה גם לטעות או לסכן.
מגבלות ותחילתו של חורף נוסף
למרות ההבטחות הגדולות, מערכות מומחה סבלו מבעיות חמורות. איסוף ידע ממומחים היה תהליך איטי ומייגע. לעיתים קרובות מומחים לא יכלו להסביר במילים את האינטואיציות שלהם, והמחשב לא ידע “להמציא” כללים חדשים. יתר על כן, ככל שהמערכת גדלה, כך הפכה לנוקשה ולא יעילה. עם התקדמות שנות ה־80, כשההתלהבות דעכה, הגיע החורף השני של ה־AI. ההבנה חלחלה: אי אפשר לייצר תבונה אנושית רק על ידי הזנה של חוקים.
אבל התקופה הזו השאירה אחריה מורשת חשובה. היא הדגישה את חשיבות הידע כמשאב מרכזי, היא הציבה את הרעיון של "מחשב כמומחה" בתוך התרבות, והיא הכינה את הקרקע למעבר הבא – לעידן שבו מחשבים ילמדו בעצמם מתוך נתונים.
מקורות
- Shortliffe, Edward H. Computer-Based Medical Consultations: MYCIN. Elsevier, 1976.
URL: https://www.sciencedirect.com/book/9780444002084/computer-based-medical-consultations-myc - Feigenbaum, Edward. “The Art of Artificial Intelligence: Themes and Case Studies of Knowledge Engineering.” IJCAI (1977).
URL: https://ijcai.org/Proceedings/77-1/Papers/049.pdf - Britannica, “Expert Systems.”
URL: https://www.britannica.com/technology/expert-system - Nilsson, Nils J. The Quest for Artificial Intelligence: A History of Ideas and Achievements. Cambridge University Press, 2010.
URL: https://www.cambridge.org/core/books/quest-for-artificial-intelligence/357CA7C4523D6E41D34A81F7A2B391E1
מהכללים להסתברות: המהפך הסטטיסטי של שנות ה־90
לאחר דעיכתו של גל מערכות המומחה בשנות ה־80, רבים הכריזו כי החלום של בינה מלאכותית אולי גדול מדי. אך דווקא בשוליים התפתח בשקט כיוון חדש שהעתיד להפוך למרכזי: שימוש בכלים סטטיסטיים והסתברותיים כדי להבין ולחזות תופעות. השינוי הזה לא היה רק טכני. הוא שיקף מהפכה עמוקה יותר: הבנה שאינטליגנציה אינה בהכרח אוסף חוקים פורמליים, אלא יכולת לפעול בעולם של אי־ודאות.
בייסיאניזם חוזר לאופנה
בלב המהפכה עמד רעיון עתיק: תורת ההסתברות של תומס בייס (Thomas Bayes, 1702–1761). המהפכה החלה כאשר חוקרים כמו ג’ודיאה פרל (Judea Pearl, נולד 1936) החיו את הבייסיאניזם והציגו כלי חדש: רשתות בייסיאניות (Bayesian Networks). אלו היו מודלים גרפיים שמאפשרים לתאר קשרי סיבה ותוצאה בין משתנים, ולהסיק מהם הסתברויות.
פתאום מחשבים יכלו להתמודד עם שאלות מורכבות כמו “מה הסבירות שמטופל סובל ממחלה מסוימת, בהינתן תסמינים חלקיים?” או “מה ההסתברות שמערכת רובוטית נתקלה במכשול, בהינתן מדידות רועשות של חיישנים?”. במקום תשובה חותכת של כן או לא, המחשב למד להחזיר טווח של הסתברויות – בדיוק כפי שעושה מוח אנושי.
תרבות טכנולוגית של שנות ה־90
כדי להבין את ההקשר חשוב להיזכר בשנות ה־90 עצמן. אלו היו השנים של הופעת האינטרנט המסחרי, של עליית Windows 95 שהכניס ממשקים גרפיים לכל בית, ושל תחילת עידן הגלובליזציה הדיגיטלית. במשרדים, מחשבים הפכו לכלי עבודה יומיומי: מכתבי Word, גיליונות Excel, ומיילים ראשונים. בתוך אווירה זו של הצפת נתונים, הבינה המלאכותית קיבלה סוף סוף חומר גלם חדש – כמויות מידע עצומות שהלכו ונאגרו.
כאן נולדה ההבנה שמידע עצמו הוא “נפט חדש”. במקום לנסות לקודד חוקים ישירות, המדענים נתנו למחשב ללמוד מתוך הנתונים עצמם. אלגוריתמים כמו עצים החלטתיים (Decision Trees) ו־אלגוריתמי אשכולות (Clustering) איפשרו לנתח נתונים גדולים ולזהות מבנים חבויים. מאוחר יותר הופיעו גם מכונות וקטורים תומכים (Support Vector Machines), שנחשבו לפריצת דרך בלמידת מכונה.
שינוי תרבותי במדע ובחברה
המעבר לחשיבה סטטיסטית התכתב עם תרבות רחבה יותר של השנים ההן. בשנות ה־90 פרחו חברות טכנולוגיה חדשות בעמק הסיליקון, אנשים דיברו על “כלכלה חדשה” ו”עידן המידע”. גם בספרות המדע הבדיוני ניכרה השפעה: סופרים כמו ויליאם גיבסון (William Gibson) דיברו על “סייברספייס” ועל נתונים כעולם חי בפני עצמו. במקביל, עולם השיווק התחיל להשתמש בנתונים לראשונה בצורה מאסיבית – למשל קמעונאיות גדולות כמו Walmart החלו לאסוף ולנתח נתוני רכישה כדי לחזות מגמות.
ההשלכה על חיי היומיום
בעוד מערכות מומחה לא הגיעו לציבור הרחב, הבינה המלאכותית הסטטיסטית התחילה לזלוג אל חיי היומיום בלי שנשים לב. מנועי חיפוש מוקדמים (כמו AltaVista ו־Yahoo) הסתמכו על שיטות דירוג מבוססות הסתברות. תוכנות דואר אלקטרוני התחילו לסנן ספאם באמצעות אלגוריתמים בייסיאניים. אפילו קרדיט סקורינג, הערכת סיכון ללקוחות בבנקים וחברות אשראי, עבר להשתמש במודלים סטטיסטיים מתקדמים.
הניצוץ לקראת העתיד
המהפכה של שנות ה־90 הייתה הרבה פחות נוצצת ממערכות מומחה או מהפרספטון. לא היו כותרות דרמטיות בעיתונים, ולא נולדו רובוטים מפורסמים. אך דווקא היא הניחה את התשתית המעשית שעליה נבנה כל ה־AI של המאה ה־21. היא לימדה אותנו שלפעמים אינטיליגנציה אינה מגיעה מחוקים נוקשים אלא מיכולת להסתגל לנתונים משתנים.
מקורות
- Pearl, Judea. Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference. Morgan Kaufmann, 1988.
URL: https://www.sciencedirect.com/book/9781558604797/probabilistic-reasoning-in-intelligent-systems - Mitchell, Tom M. Machine Learning. McGraw-Hill, 1997.
URL: https://www.cs.cmu.edu/~tom/mlbook.html - Britannica, “Artificial Intelligence – Reasoning and Uncertainty.”
URL: https://www.britannica.com/technology/artificial-intelligence/Reasoning-and-uncertainty - Nilsson, Nils J. The Quest for Artificial Intelligence: A History of Ideas and Achievements. Cambridge University Press, 2010.
URL: https://www.cambridge.org/core/books/quest-for-artificial-intelligence/357CA7C4523D6E41D34A81F7A2B391E1
משחקים כמעבדה לאינטליגנציה: משחמט ועד ג'פרדי!
מאז ומעולם משחקי חשיבה היו שדה ניסוי מועדף למדעני מחשב. המשחק מגדיר חוקים ברורים, תוצאה חד־משמעית של ניצחון או הפסד, ומרחב אסטרטגיות שניתן למדוד ולשכלל. מבחינה תרבותית, משחקים תמיד סימלו את גבול היכולת האנושית – כך שהצלחת מחשב במשחק נחשבה כהוכחה ליכולות “חכמות”.
השחמט כזירת קרב סימבולית
שחמט נחשב במשך מאות שנים ל”משחק המלכים”, מבחן עליון ליכולות אינטלקטואליות. במאה ה־20 אלופי שחמט נתפסו כסמלים לא רק של גאונות אישית אלא גם של עליונות תרבותית – במיוחד בתקופת המלחמה הקרה. לכן, כאשר IBM פיתחה בשנות ה־90 את Deep Blue, מחשב ייעודי למשחק שחמט, העולם עקב בדריכות.
ב־1997 הגיע הרגע ששינה את ההיסטוריה: אלוף העולם גארי קספרוב (Garry Kasparov, נולד 1963), שנחשב לאחד מגדולי השחמטאים בהיסטוריה, הפסיד ל־Deep Blue בסדרה של שישה משחקים. הכותרות בעיתונים הכריזו “המחשב ניצח את האדם”, והאירוע עורר סערה עולמית. עבור הציבור הרחב, זו הייתה עדות דרמטית לכך שמכונה יכולה לגבור על מוח אנושי במגרש שבו נחשבה הגאונות האנושית לנעלה ביותר.
מבחינה טכנית, Deep Blue לא היה “חכם” במובן האנושי. הוא לא הבין שחמט כמו קספרוב, אלא חישב מיליוני מצבים בשנייה והשתמש באלגוריתמים להערכת עמדות. אך התרבות לא ראתה את ההבדל – עבור העולם, זה היה ניצחון של מכונה על מוח אנושי.
ג'פרדי! – המחשב שעונה על שאלות
בעשור הבא הגיעה נקודת מבחן חדשה: שפה טבעית. בניגוד לשחמט, שבו החוקים ברורים, שפה אנושית מלאה בעמימות, הקשרים, ומשחקי מילים. כאן הופיעה מערכת Watson של IBM.
ב־2011 התמודד Watson בתוכנית הטלוויזיה האמריקאית הפופולרית Jeopardy!, מול שני האלופים הגדולים ביותר של המשחק: קן ג’נינגס (Ken Jennings, נולד 1974) ובראד רטר (Brad Rutter, נולד 1978). המערכת נדרשה להבין שאלות בשפה טבעית, לאתר מידע רלוונטי במאגר עצום, ולנסח תשובה מדויקת – וכל זה במהירות של תחרות טלוויזיונית.
כאשר Watson ניצח בנקודות את שני האלופים, הקהל באולפן מחא כפיים, והעולם כולו הביט בתדהמה. רבים ראו בכך רגע שבו מחשב לא רק “חושב” אלא גם משתתף במשחק אנושי קלאסי, מול בני אדם בשר ודם. עבור IBM זו הייתה חגיגה שיווקית אדירה, והמערכת הפכה לסמל של פוטנציאל חדש: מחשבים שיכולים להבין ולעבד שפה אנושית לצרכים פרקטיים כמו רפואה, פיננסים, ומשפט.
המשחקים כחלון תרבותי
חיי היומיום בשנות ה־90 וה־2000 התאפיינו בחדירה הולכת וגוברת של מחשבים לבית ולעבודה: מחשבים אישיים, אינטרנט, ואחר כך סמארטפונים. בתוך ההקשר הזה, ניצחונות של מחשבים במשחקים סימלו משהו גדול יותר. לא עוד מכונה ענקית במעבדה – אלא כלי שמסוגל להיכנס אל תוך התרבות הפופולרית, להשתתף במשחקי חברה, ולנצח בהם.
שחמט ו־Jeopardy! לא היו רק ניסויים מדעיים. הם היו אירועים תרבותיים, שהבהירו לציבור הרחב שהמחשב איננו עוד מכונה טיפשה, אלא שחקן בזירה אינטלקטואלית. המשחקים הללו סיפקו לעולם “סיפורים טובים” – הכרחיים כדי להפוך טכנולוגיה מופשטת לסמל שמובן לכולם.
המורשת
הצלחות במשחקים הראו לעולם שהמחשב מסוגל להתמודד עם משימות שבעבר נחשבו מובהק לאדם. הן שימשו זרז למחקרים נוספים – החל מהבנת שפה טבעית ועד לשימוש בלמידת מכונה ליישומים עסקיים ורפואיים. ובעיקר, הן הפכו את הבינה המלאכותית משיח אקדמי לשיחה ציבורית.
מקורות
- Hsu, Feng-hsiung. Behind Deep Blue: Building the Computer that Defeated the World Chess Champion. Princeton University Press, 2002.
URL: https://press.princeton.edu/books/paperback/9780691090658/behind-deep-blue - Campbell, Murray; Hoane, Joseph; Hsu, Feng-hsiung. “Deep Blue.” Artificial Intelligence, 134(1–2): 57–83, 2002.
URL: https://doi.org/10.1016/S0004-3702(01)00129-1 - Ferrucci, David et al. “Building Watson: An Overview of the DeepQA Project.” AI Magazine, 31(3): 59–79, 2010.
URL: https://ojs.aaai.org/index.php/aimagazine/article/view/2303 - Britannica, “Artificial Intelligence – Playing Games.”
URL: https://www.britannica.com/technology/artificial-intelligence/Playing-games
המהפכה של 2012: למידת העומק, ImageNet והרגע שבו המכונה התחילה לראות
במשך עשורים הבטיחו חוקרי בינה מלאכותית שהמחשב יום אחד ילמד בעצמו להבין את העולם. אבל עד תחילת המאה ה־21 זה לא קרה באמת. המחשבים הצליחו לחשב, להפעיל חוקים, ואפילו להעריך הסתברויות, אבל הם עדיין לא הצליחו לזהות תמונה פשוטה של חתול או להבין משפט בשפה טבעית כמו בני אדם. ואז, בשנת 2012, התרחש מהפך דרמטי.
התחרות ששינתה את הכל
בכל שנה התקיימה תחרות בינלאומית בשם ImageNet Challenge. המטרה הייתה פשוטה אך קשה להפליא: מחשבים נדרשו לזהות אובייקטים מתוך מאגר עצום של מיליוני תמונות מסומנות. עד 2012, גם האלגוריתמים הטובים ביותר שגו לעיתים קרובות. ואז הופיעה קבוצה קטנה מאוניברסיטת טורונטו, בראשות ג'פרי הינטון (Geoffrey Hinton, נולד 1947), עם מודל בשם AlexNet.
AlexNet היה רשת עצבית עמוקה – Deep Neural Network – שהורכבה משמונה שכבות למידה. המודל אומן באמצעות כרטיסי מסך גרפיים (GPU), שנועדו בכלל לעולם משחקי המחשב. השימוש ב־GPU איפשר עוצמת חישוב אדירה, והמודל הצליח להוריד את שיעור הטעויות בתחרות כמעט בחצי בהשוואה לכל מתחרה אחר. הקהילה המדעית נדהמה. העולם הבין: החזון של רשתות עצביות לא מת בשנות ה־60, הוא פשוט חיכה ליום שבו יהיו מספיק נתונים ועוצמת מחשוב כדי לפרוץ.
איך זה נראה בחיי היומיום
הפריצה של ImageNet לא נשארה בגבולות המעבדה. בתוך שנים ספורות, הרעיונות של AlexNet נכנסו כמעט לכל תחום בחיים. מצלמות בסמארטפונים התחילו לזהות פנים, לסדר אלבומים לפי אנשים ולפתוח מכשירים בלי סיסמה. מערכות זיהוי דיבור השתפרו והחלו להזין עוזרות אישיות כמו Siri ו־Google Assistant. במכוניות, מערכות נהיגה אוטונומיות ראשונות התבססו על אותן טכניקות לזיהוי הולכי רגל ותמרורים.
בבתים פרטיים הופיעו רמקולים חכמים. בחנויות אונליין הופיעו מנועי המלצות שהתבססו על מודלים לומדים. חיי היומיום השתנו כמעט מבלי שהציבור שם לב: הטכנולוגיה שפעם הייתה “בינה מלאכותית” הפכה לסטנדרט.
הרקע התרבותי
שנות ה־2010 היו תקופה שבה הטכנולוגיה כבר לא נראתה כמו מדע בדיוני רחוק. האייפון הראשון יצא ב־2007, הרשתות החברתיות כבר שלטו בעולם, והציבור התרגל לשדרג מכשירים כל שנתיים. בתוך ההקשר הזה, העובדה שמחשבים פתאום מזהים תמונות ומבינים מילים נתפסה לא כנס אלא כצעד טבעי. אבל עבור החוקרים זו הייתה מהפכה אדירה: סוף סוף מכונה הצליחה “לראות” ו“להקשיב” באמת.
המורשת של AlexNet
הניצחון ב־2012 שינה את הכיוון של תחום שלם. מיליארדי דולרים זרמו למחקר ופיתוח של רשתות עמוקות. ענקיות הטכנולוגיה כמו גוגל, פייסבוק ומיקרוסופט הקימו צוותי למידת עומק והשקיעו בגיוס חוקרים. העולם האקדמי הצמיח תחום חדש שלם – Deep Learning – שהפך להיות שפת האם של בינה מלאכותית מודרנית.
אפשר לומר ש־2012 היה הרגע שבו בינה מלאכותית עשתה קפיצה מ"הבטחה" ל"מציאות". עד אז, היא הייתה חלום של חוקרים. מאז ImageNet, היא הפכה לכוח שמתחיל לעצב את חיי היומיום של כולנו.
מקורות
- Krizhevsky, Alex; Sutskever, Ilya; Hinton, Geoffrey E. “ImageNet Classification with Deep Convolutional Neural Networks.” Advances in Neural Information Processing Systems (NIPS), 2012.
URL: https://proceedings.neurips.cc/paper/2012/hash/c399862d3b9d6b76c8436e924a68c45b-Abstract.html - LeCun, Yann; Bengio, Yoshua; Hinton, Geoffrey. “Deep Learning.” Nature, 521(7553): 436–444, 2015.
URL: https://www.nature.com/articles/nature14539 - Britannica, “Artificial Intelligence – Deep Learning.”
URL: https://www.britannica.com/technology/artificial-intelligence/Deep-learning - Sejnowski, Terrence J. The Deep Learning Revolution. MIT Press, 2018.
URL: https://mitpress.mit.edu/9780262038034/the-deep-learning-revolution
AlphaGo 2016: המשחק שהוכיח שמכונות מסוגלות להפתיע
בשנת 2016 נערכה תחרות משחקי גו (Go) שהפכה לאבן דרך בהיסטוריה של הבינה המלאכותית. עד אז, גם אחרי הצלחת Deep Blue בשחמט ב־1997, רבים טענו כי מחשבים אינם באמת “חכמים” אלא רק סורקים אפשרויות. שחמט, עם החוקים הברורים שלו, היה כביכול “קל” למחשב. גו, לעומת זאת, נחשב לבלתי אפשרי עבור מכונה – לוח עצום של תשע עשרה על תשע עשרה, עם מספר מצבים אפשריים הגדול יותר ממספר האטומים ביקום הנצפה. במשך שנים, מומחים העריכו שיעברו עוד עשורים עד שמחשב יוכל לנצח אלוף עולם בגו.
ההכנה
באותן שנים פעלה חברת DeepMind, שנוסדה ב־2010 בלונדון על ידי דמיס חסאביס (Demis Hassabis, נולד 1976), יחד עם שותפיו שיין לג (Shane Legg) ומוסטפא סלימאן (Mustafa Suleyman). החברה הציבה לעצמה יעד שאפתני: לפתח מערכות לומדות שיכולות לשלוט במיומנויות מורכבות כמו אדם. אחרי שנרכשה על ידי Google ב־2014, DeepMind קיבלה את המשאבים הדרושים להמר הגדול: מערכת בשם AlphaGo.
השיטה
AlphaGo לא הייתה כמו Deep Blue. במקום להסתמך רק על כוח חישוב עצום, היא שילבה בין רשתות עצביות עמוקות לבין למידת חיזוק (Reinforcement Learning). היא למדה תחילה ממשחקי אדם קיימים, אך לאחר מכן שיחקה מיליוני משחקים נגד עצמה, שיפרה את האסטרטגיות שלה, ופיתחה יכולות שלא נראו קודם לכן. כדי להתמודד עם המרחב האדיר של המשחק, השתמשה AlphaGo גם ב־חיפוש עץ מונטה־קרלו (Monte Carlo Tree Search), טכניקה שמאזנת בין חיפוש אקראי לבין בחירה אסטרטגית.
הרגע ששבר את העולם
במרץ 2016 נפגשו AlphaGo ו־Lee Sedol (לי סדול, נולד 1983), אחד מאלופי העולם הגדולים ביותר במשחק גו. סדרה בת חמישה משחקים שודרה בשידור חי לקהל עצום באסיה ובעולם כולו. כבר במשחק הראשון היכה המחשב את סדול בהפתעה. במשחק השני הגיע הרגע ההיסטורי: מהלך 37.
במהלך זה, AlphaGo שיחקה מהלך לא צפוי לחלוטין – צעד שנראה תחילה כטעות גסה, אך התברר כגאוני בהמשך המשחק. פרשנים ואנשי מקצוע נדהמו. שדרים כינו אותו “מהלך יפהפה, כמעט אנושי”. לראשונה, מכונה לא רק חישבה נכון, אלא גם שיחקה מהלך שנתפס כיצירתי ומקורי. בסוף הסדרה ניצחה AlphaGo 4–1, וניפצה את כל התחזיות.
ההדים התרבותיים
ההשפעה על התרבות הייתה עצומה. מיליוני אנשים באסיה צפו במשחקים, והאירוע תואר כ”ספוטניק של ה־AI”. הציבור הבין שהגענו לרגע חדש: מכונות כבר לא רק מבצעות חישובים אלא מראות יצירתיות. עבור אנשי שיווק, מנהלים ויזמים, זה היה רגע שבו היה ברור שאסור להתעלם יותר מבינה מלאכותית – היא עומדת לשנות את הכלכלה, את התרבות ואת חיי היומיום.
סרט תיעודי של Netflix בשם AlphaGo (2017) הנציח את האירוע והפך אותו לאבן דרך פופולרית. הוא הציג לא רק ניצחון טכנולוגי אלא גם סיפור אנושי: סדול שנאבק על כבוד האדם מול המכונה, והחוקרים שראו בחזונם מתגשם.
חיי היומיום אחרי AlphaGo
הטכנולוגיות שפותחו באלפאגו – למידת חיזוק ורשתות עמוקות – זלגו במהירות לעולמות אחרים. Google השתמשה בהן לשיפור מערכות אנרגיה, להפחתת צריכת חשמל במרכזי נתונים, ולשדרוג תרגום שפות. חברות אחרות אימצו את הגישה למשחקים, מסחר, רובוטיקה ורפואה. הציבור הרחב הבין שה־AI כבר לא משחק – הוא כלי שמשנה תעשיות שלמות.
מורשת
AlphaGo לא היה רק ניצחון במשחק. הוא היה הרגע שבו בינה מלאכותית הראתה שהיא מסוגלת להפתיע, להיות יצירתית, וללמד אותנו אסטרטגיות חדשות. מאז, כל דיון על יצירתיות מכונה – אם זה אמנות, מוזיקה או אסטרטגיה עסקית – נושא עמו את זכר מהלך 37.
מקורות
- Silver, David et al. “Mastering the Game of Go with Deep Neural Networks and Tree Search.” Nature, 529: 484–489, 2016.
URL: https://www.nature.com/articles/nature16961 - Hassabis, Demis. “AlphaGo: Mastering the Ancient Game of Go with Machine Learning.” DeepMind Blog, 2016.
URL: https://deepmind.google/discover/blog/alphago-mastering-the-game-of-go-with-machine-learning - Documentary Film: AlphaGo (2017), Directed by Greg Kohs, Netflix.
URL: https://www.netflix.com/title/80190844 - Britannica, “Artificial Intelligence – Reinforcement Learning and Games.”
URL: https://www.britannica.com/technology/artificial-intelligence/Reinforcement-learning
מהפכת הטרנספורמרים: הרגע שבו השפה נפתחה למכונות
בשנת 2017 פורסם מאמר מחקרי שעתידו לשנות את כל תחום הבינה המלאכותית. שמו היה פשוט אך חתרני: Attention Is All You Need. המאמר הציג ארכיטקטורה חדשה ללמידת מכונה – הטרנספורמר (Transformer) – שהפכה תוך שנים ספורות ללב־ליבה של כל מערכת AI מודרנית.
מה היה כל כך מיוחד בטרנספורמרים
לפני 2017, רוב מערכות עיבוד השפה נשענו על מודלים סדרתיים, כמו RNNs (Recurrent Neural Networks) ו־LSTMs (Long Short-Term Memory). הבעיה הייתה שהמודלים הללו התקשו להתמודד עם טקסטים ארוכים, הקשרים מורכבים, ושפה טבעית גמישה.
הטרנספורמרים הביאו רעיון חדש: מנגנון תשומת הלב (Attention). במקום לעבור על המילים בסדר ליניארי, המודל לומד לשים “תשומת לב” לחלקים שונים במשפט בו־זמנית. זה איפשר לו להבין הקשרים גלובליים, לטפל בטקסטים עצומים, וללמוד שפה בצורה שלא נראתה קודם.
ההשלכות המיידיות
כבר ב־2018 הופיע BERT (Bidirectional Encoder Representations from Transformers), מודל שפותח על ידי Google והפך לכלי מרכזי במחקר עיבוד שפה. BERT שיפר משמעותית מערכות חיפוש, תרגום ושאלות־תשובות. פתאום, מחשבים התחילו להבין משפטים לא רק לפי מילה בודדת אלא גם לפי ההקשר הרחב שלהם.
במקביל, חברות כמו OpenAI אימצו את הארכיטקטורה החדשה ופיתחו מודלים גנרטיביים – GPT (Generative Pretrained Transformer). כאן נולד רעיון המודל הענק שמאומן מראש על כמויות אדירות של טקסט מהאינטרנט ואז מותאם למשימות שונות. היכולת של GPT להשלים משפטים, לענות על שאלות וליצור טקסטים חדשים הפתיעה גם את החוקרים עצמם.
ההקשר התרבותי
שנות העשור הראשון של ה־2020 היו שנים של “כלכלה מבוססת נתונים”. הרשתות החברתיות שלטו, הטלפונים החכמים הפכו לחלק מהגוף, וזרמי המידע היו אינסופיים. בתוך ההקשר הזה הופעת מודלים שיכולים “לקרוא” ולהבין שפה אנושית ברמה גבוהה נראתה טבעית אך גם מטלטלת. פתאום, מכונה לא רק שיחקה שחמט או גו – היא כתבה שירה, יצרה סיפורים, וסייעה לאנשים לנסח רעיונות.
המהפכה הזו לא נשארה בגבולות המדע. היא חדרה לשיווק, לעסקים, לחינוך ולתרבות. אנשי פרסום החלו להשתמש במודלים לכתיבת קמפיינים, מורים ניסו לשלב אותם בהכנת מערכי שיעור, וחוקרים גילו כלים חדשים לסיכום וניתוח טקסטים. המושג “מודל שפה גדול” הפך לשיחת היום.
חיי היומיום משתנים
משנת 2020 ואילך, הופעת ChatGPT והגרסאות של GPT הביאו את המהפכה ישירות אל הציבור הרחב. מיליוני אנשים השתמשו במודלים כדי לנסח מיילים, לכתוב קוד, לקבל ייעוץ, או פשוט לשוחח. מה שפעם היה תחום אקדמי נישתי הפך לכלי שכל אחד יכול לגשת אליו. עבור רבים זה היה רגע שבו הגבול בין אדם למכונה היטשטש באופן חסר תקדים.
מורשת
הטרנספורמרים לא רק שיפרו את הטכנולוגיה. הם שינו את ההגדרה של בינה מלאכותית עצמה. במקום מערכות צרות שמבצעות משימה אחת היטב, נולד חזון של מודלים כלליים שיכולים ללמוד, להתאים את עצמם, ולפעול במגוון עצום של תחומים.
מקורות
- Vaswani, Ashish et al. “Attention Is All You Need.” Advances in Neural Information Processing Systems (NIPS), 2017.
URL: https://arxiv.org/abs/1706.03762 - Devlin, Jacob et al. “BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding.” arXiv, 2018.
URL: https://arxiv.org/abs/1810.04805 - Brown, Tom B. et al. “Language Models are Few-Shot Learners.” Advances in Neural Information Processing Systems, 2020.
URL: https://arxiv.org/abs/2005.14165 - Britannica, “Artificial Intelligence – Natural Language Processing.”
URL: https://www.britannica.com/technology/artificial-intelligence/Natural-language-processing
הפריצה לציבור הרחב: GPT DALL·E ChatGPT והעידן הגנרטיבי
עד ראשית שנות העשרים של המאה העשרים ואחת הבינה המלאכותית נתפסה בעיקר כטכנולוגיה של חוקרים וחברות גדולות. הציבור שמע עליה אך לא נגע בה ממש. זה השתנה ברגע אחד כאשר הופיעו מודלים גנרטיביים עצומים שאפשרו לכל אדם לשוחח עם מחשב כאילו הוא בן אנוש או ליצור תמונה מורכבת מתוך משפט טקסט פשוט.
GPT והקפיצה של מודלי השפה
ב־2020 פרסמה חברת OpenAI את GPT 3 מודל שפה עצום שאומן על מאות מיליארדי מילים. בניגוד למודלים ישנים שהיו מיועדים למשימה אחת בלבד GPT 3 ידע לבצע מגוון עצום של משימות מכתיבה ספרותית ועד כתיבת קוד תוכנה. אחד הדברים המרעישים היה היכולת שלו להבין הקשר ולתת תשובות שנשמעות קרובות מאוד לכתיבה אנושית. פתאום מחשבים לא רק ניתחו טקסט אלא גם יצרו אותו מחדש.
ב־2022 הופיע ChatGPT ממשק שיחה המבוסס על GPT 3.5. בניגוד למאמרים אקדמיים או דוחות טכניים כאן היה מדובר בכלי זמין שכל אחד יכול לפתוח בדפדפן ולהתחיל לשוחח. בתוך שבועות ספורים הצטרפו אליו מיליוני משתמשים. מורים ותלמידים אנשי שיווק ועיתונאים מתכנתים ואפילו סופרים החלו לנסות את כוחו. ChatGPT לא היה רק כלי אלא חוויה חברתית חדשה. אנשים ישבו מול המסך ושאלו שאלות עמוקות או יומיומיות וקיבלו תשובות ברורות לעיתים מפתיעות ולעיתים מרגשות.
DALL·E ותמונות מתוך מילים
במקביל OpenAI פיתחה את DALL·E מערכת שיכולה לייצר תמונות חדשות לחלוטין מתוך תיאור טקסטואלי. פתאום כל אדם יכל להפוך לאמן דיגיטלי. משתמש כתב משפט כמו “חתול עם כובע טייס יושב על הירח” ותוך שניות קיבל תמונה שלא הייתה קיימת בעולם קודם לכן. בכך נפתח עידן חדש של יצירה ויזואלית שבו גבולות הדמיון התרחבו כמעט ללא סוף.
הציבור הרחב נדהם. רשתות חברתיות התמלאו ביצירות גנרטיביות. מעצבים גילו כלי חדש לשיווק חזותי. תלמידים השתמשו בו כדי להכין עבודות יצירתיות. אמנים מצד אחד התלהבו מהאפשרויות ומצד אחר חששו מאובדן מקור פרנסה.
תרבות וכלכלה בעידן הגנרטיבי
הופעת GPT ו DALL·E הציתה דיון עולמי. האם מכונות באמת יצירתיות או רק מחקות את מה שנמצא בנתונים? האם זו תחילת עידן שבו מקצועות שלמים יוחלפו על ידי בינה מלאכותית? עבור אנשי שיווק ועסקים זו הייתה מתנה עצומה. פתאום ניתן לייצר תוכן בכמויות אדירות בעלות נמוכה ולהגיע ללקוחות בקצב שלא נראה קודם.
עבור החברה כולה זו הייתה חוויה תרבותית. לראשונה בהיסטוריה מיליוני אנשים יכלו לדבר עם מכונה יצירתית כאילו הייתה חבר לשיחה. היו שראו בזה איום על האותנטיות האנושית והיו שראו בזה כלי חדש לשחרור הדמיון.
חיי היומיום משתנים
מאז 2023 אפשר לראות את ההשפעות בכל מקום. כתיבה אוטומטית במיילים ובצ’טים. כלי תמיכה בלמידה בבתי ספר ובאוניברסיטאות. עזרי תרגום מתקדמים. מערכות הפקה בשיווק ופרסום. אפילו בתחומי הרפואה והמשפט החלו להופיע ניסויים ראשונים בשימוש במודלים גנרטיביים.
המשמעות התרבותית עמוקה. אם המהפכה התעשייתית של המאה ה־19 שינתה את עבודת הידיים ואם מהפכת המחשבים של המאה ה־20 שינתה את עבודת המוח הרי שהעידן הגנרטיבי משנה את עבודת היצירה עצמה.
מורשת
הפריצה לציבור הרחב הפכה את הבינה המלאכותית מנושא אקדמי או טכנולוגי צר לכלי חברתי ותרבותי. לא עוד “מחשב שעוזר במדע” אלא שותף יומיומי בחיים של מיליונים. זהו שלב שבו הדיון עבר משאלה “האם מכונה יכולה לחשוב” לשאלה “כיצד נחיה יחד עם מכונות שיודעות לכתוב לצייר ולדבר”.
מקורות
- Brown, Tom B. et al. “Language Models are Few-Shot Learners.” arXiv, 2020.
URL: https://arxiv.org/abs/2005.14165 - OpenAI, “Introducing ChatGPT.” OpenAI Blog, November 2022.
URL: https://openai.com/blog/chatgpt - Ramesh, Aditya et al. “Zero-Shot Text-to-Image Generation.” arXiv, 2021.
URL: https://arxiv.org/abs/2102.12092 - Vincent, James. “DALL-E: Creating Images from Text.” The Verge, 2021.
URL: https://www.theverge.com/2021/1/5/22214924/openai-dall-e-ai-images-text
ההווה והעתיד: בינה מלאכותית כחלק מהחיים החברתיים והכלכליים ומה זה אומר עלינו כבני אדם
בימים אלה בינה מלאכותית איננה עוד תחום אקדמי או ניסוי במעבדות של כמה חוקרים. היא הפכה למרכיב יסודי בכל תחום של חיי היומיום. מנועי חיפוש משתמשים בה כדי להחזיר תשובות מותאמות. אתרי קניות נעזרים בה כדי להמליץ על מוצרים. רופאים משלבים אותה בבדיקות דימות ובאבחון מחלות. בנקים וסטארט־אפים בונים מודלים לחיזוי סיכונים כלכליים. ובעולם התרבות, יצירה אמנותית מבוססת בינה מלאכותית מציפה את הרשתות החברתיות.
בינה מלאכותית כשותפה אנושית
המונח “שותפה” נעשה שכיח. לא עוד כלי חישוב בלבד אלא משהו שמדבר איתנו, כותב איתנו, ואפילו יוצר איתנו. ChatGPT ומודלים דומים הפכו לחלק מהעבודה היומיומית של מיליוני אנשים: ניסוח מיילים, כתיבת קמפיינים שיווקיים, חיבור מאמרים, קוד תוכנה, ואפילו שיחות אישיות. עבור חלק מהאנשים זו עזרה פרקטית, עבור אחרים זה מקור השראה ותחושת יצירתיות משותפת.
שאלות אתיות וחברתיות
עם הכוח מגיעה גם האחריות. חברות וקהילות נדרשות להתמודד עם שאלות חדשות: מי אחראי לתוכן שיצרה מכונה אם הוא מטעה או פוגעני? האם נכון לתת למודלים גישה לנתונים אישיים? מה יקרה לשוק העבודה כאשר תחומים שלמים כמו שירות לקוחות, תרגום, עריכה או עיצוב יעברו אוטומציה?
במקביל עולה השאלה העמוקה יותר: אם מכונות יכולות לכתוב שירה, לצייר ציור או לפתח אסטרטגיה עסקית – מה נשאר ייחודי לאדם? חלק מהחוקרים טוענים שהאנושיות שלנו טמונה לא רק ביכולת ליצור אלא גם במשמעות שאנו מעניקים ליצירה. הבינה המלאכותית מייצרת מילים ותמונות אך היא איננה חווה אותן.
ההקשר הכלכלי
כלכלה עולמית שלמה מתחילה להתעצב סביב בינה מלאכותית. השקעות ענק מוזרמות לסטארט־אפים בתחום. ממשלות מתחרות על מחקר ופיתוח. חברות ענק שואלות לא “האם להשתמש ב־AI” אלא “כיצד להשתמש בו בכל תחום”. עבור אנשי שיווק מדובר במהפכה אמיתית: אפשר לייצר תוכן מותאם אישית לכל לקוח בקנה מידה עצום, לעקוב אחרי תגובות ולשפר בזמן אמת, ולבנות קמפיינים שלא היו אפשריים בעידן האנלוגי.
ההקשר התרבותי
תרבות הפופ כבר אימצה את ה־AI כאחד הנושאים המרכזיים. סרטים, סדרות וספרים ממשיכים לשאול האם מכונות יעלו על יוצריהם, האם נוכל לשמור על שליטה, ואיך תיראה חברה שבה הגבול בין אדם למכונה מיטשטש. הציבור נע בין התלהבות אדירה לחרדה ממשית. מצד אחד אנשים נהנים מהעזרה והיצירתיות שמציעים המודלים. מצד אחר הם חוששים מעולם שבו מכונות יחליפו עבודות ויפגעו בזהות האנושית.
ההווה כצומת היסטורי
אפשר לראות את התקופה הנוכחית כצומת. מצד אחד אנו בעיצומה של פריחה מדעית וטכנולוגית שיכולה לשפר את הבריאות, הכלכלה, החינוך והחיים החברתיים. מצד אחר אנו ניצבים בפני שאלות מוסריות וחברתיות חסרות תקדים. מה שנעשה כעת ישפיע לא רק על השימוש בכלי זה או אחר אלא על עיצובו של המרחב האנושי כולו.
העתיד
קשה לחזות בדיוק כיצד ייראה העתיד אך ברור כי הוא יהיה עתיד שבו בינה מלאכותית היא לא רק טכנולוגיה אלא שכבת יסוד של החברה. מודלים רב־תחומיים ילמדו לשלב טקסט תמונה קול ותנועה. מערכות ישתלבו עם רובוטיקה ויחדרו לעולם הפיזי. השיח על “מודלים כלליים של בינה מלאכותית” (AGI) כבר אינו בדיוני לחלוטין.
בין אם נבחר לראות במכונה כלי בידי האדם ובין אם נתייחס אליה כאל שותפה בעלת תכונות עצמאיות – ברור שהבינה המלאכותית היא לא עוד חידוש טכנולוגי אלא פרק חדש בסיפור האנושי.
מקורות
- Russell, Stuart; Norvig, Peter. Artificial Intelligence: A Modern Approach. Pearson, 4th Edition, 2021.
URL: https://aima.cs.berkeley.edu - Crawford, Kate. Atlas of AI: Power, Politics, and the Planetary Costs of Artificial Intelligence. Yale University Press, 2021.
URL: https://yalebooks.yale.edu/book/9780300209570/atlas-of-ai - Bostrom, Nick. Superintelligence: Paths, Dangers, Strategies. Oxford University Press, 2014.
URL: https://global.oup.com/academic/product/superintelligence-9780198739838 - Britannica, “Artificial Intelligence – Present and Future.”
URL: https://www.britannica.com/technology/artificial-intelligence
