אנו שומעים יותר ויותר הצלחות בשימוש ברשתות עצביות מלאכותיות. כאן הם מציירים תמונות, כאן הם כותבים שירה. יצירתיים ולמדו אוטודידקט, האם הם לא ייקחו על עצמנו את עבודתנו בקרוב?

התאמן על חתולים
דרכים חדשות לשימוש ברשתות עצביות מלאכותיות צצות יותר ויותר. להלן דוגמא לימים האחרונים. מהנדס Nvidia רוברט בונד יצר מערכת אוטומטית לטיפול בחתולי השכן, שאוהבים לפלוש לרכושו ללא דרישה. החיות שמסמנות את השטח וצורחות בלילה היו מאוד מעצבנות עבור המהנדס. כעת, ברגע שהחתול מופיע באתר, המערכת מזהה אותו ומפעילה את מרססי המים, המפחידים את החיה.
אתם שואלים, מה הקשר לרשת העצבית? ובכן, אז נסה להסביר למחשב מהו חתול ואיך הוא נראה. זהו חתול, ולא כל חיה אחרת שנכנסה לאתר שלה בטעות. לא כלב או עורב מקרי, ועוד פחות מכך בונד עצמו, שיצא לאתר שלו, אם כי בהתחלה הוא קיבל אותו גם מכריות ההשקיה.
הרשת העצבית המלאכותית Caffe ממלאת תפקיד מרכזי במערכת אנטי-קלציה זו. מוטלת עליו המשימה לקבוע מיהו בדיוק המבקר במדשאה. בעזרת מצלמה מערכת האבטחה עוקבת אחר כל התנועות באזור המוגן. ברגע שמופיע אובייקט לא מזוהה על כר הדשא, הוא מצולם ותמונותיו מועברות ל- Jetson TX1 - מודול חומרה מבית Nvidia, המיועד גם לזיהוי תמונות. אם הרשת העצבית מזהה שיש חתול בתצלומים, הממטרה הקרובה אליו נדלקת מיד, מה שמפחיד את החיה. אבל בעתיד, אלא אם כן, כמובן, מגני בעלי חיים לא יעצרו את המהנדס המצאתי, בונד מקווה ליצור מערכת שתירה מים לעבר חתולים במטרה.
האם ניתן לכוון את המערכת לכלבים או, למשל, רק לחתולי ג'ינג'ר? פחית. היתרון של רשתות עצביות הוא שהן אינן צריכות להסביר "מילולית" מהו חתול. היא פשוט צריכה הרבה תמונות של החיות האלה - מה שנקרא סט אימונים. הרשת עצמה מוצאת תכונות בתמונות האופייניות לחתולים וזוכרות אותן. זו למידה. כעת, לאחר שהרשת הוכשרה, היא תוכל לזהות את החתול בתמונות. אגב, אתה יכול לנסות את הרשת העצבית Caffe, שנוצרה על ידי מדענים מאוניברסיטת קליפורניה בברקלי, ולראות כיצד היא מבדילה חתולים מכלבים ב- /demo.caffe.berkeleyvision.org/. העלה תמונה או הדבק אליה קישור והמערכת תספר לך מה מוצג בתמונה.

חדש הוא ישן, אך לא נשכח כלל
אם נראה לך שרשתות עצביות מלאכותיות הן משהו חדש לגמרי, אז זה לא לגמרי נכון. אפילו המונח "רשת עצבית" עצמו הופיע באמצע המאה הקודמת. ואז, עם שחר עידן המחשבים, עדיין לא הייתה הסכמה לגבי אופן בניית עקרון הפעולה של המחשבים.
בתחילה היו לפחות שתי ארכיטקטורות מחשב מבטיחות. אחד מהם - אדריכלות פון נוימן - היה פשוט יחסית והחל ליישם בפועל. כעת העקרונות שלה מונחים בבסיס כמעט כל המחשבים הקיימים. הרשתות העצביות האחרות (מחשבי רשת עצבית), הפכו למושא מחקר של תיאורטיקנים. כתוצאה מכך, עם הזמן שחלף מאז אותו רגע, הצטבר בסיס תיאורטי משמעותי, שבמיוחד איפשר להבין סוף סוף כיצד ללמד רשתות עצביות.
בנוסף, באותה תקופה לא ניתן היה לפעול עם כמויות גדולות של נתונים.לדוגמה, המערך הזמין לציבור של תמונות שכבר מסומנות, ImageNet מכיל יותר ממיליון תמונות, ולכן הדרישות לכוח החישוב של רשתות עצביות גבוהות למדי.
כל הזמן הזה, רשתות עצביות חיכו בכנפיים. היום המצב השתנה. בעבודה עם רשתות עצביות, הם החלו להשתמש בכרטיסי מסך בעלי ביצועים גבוהים, וזה איפשר להאיץ את האימון פי עשרה. לא במקרה Nvidia - המובילה בעולם בייצור כרטיסי מסך - הסתמכה על למידה מעמיקה של רשתות עצביות.

לשתי ארכיטקטורות, פון נוימן והרשת העצבית, יש הבדלים משמעותיים. אך ההבדל החשוב ביותר הוא כמובן האפשרות ללמידה עצמית של הרשת העצבית. אם מחשבים קלאסיים עובדים על פי תוכנית שנכתבה בעבר על ידי אדם, אז ניתן להכשיר מחשב נוירוני. עבור מחשבים מסורתיים, תוכניות נכתבות, הרשת העצבית מסוגלת ללמוד ולפעול על סמך הניסיון שנצבר. מה, עם זאת, אינו שולל את הצורך בהדרכה ממוקדת והתאמת רשת. על ידי "הזנת" המכונה תמונות רבות, שהרשת יודעת מראש שמדובר בחתול, כלב, או למשל עורב וכן הלאה, אתה מאמן אותו לזהות תמונות. בכל הנוגע ליישום המעשי של המיומנויות הנרכשות, הרשת תוכל לקבוע מה מוצג בתמונה על ידי הסימנים שהיא עצמה ציינה בתהליך הלמידה, ותתן מענה הולם.
להלן דוגמה טובה ליישום הטכנולוגיה לזיהוי תבניות. כיום, חיפושים של תמונות באינטרנט מבוססים על מילות מפתח. מנוע החיפוש מחפש תמונה לבקשתך, תוך התמקדות בטקסט המלווה את התמונה בדף האתר. אם המאמר עוסק בחתולים, אז הגיוני להניח שהתמונות בטקסט הן תמונות של חתולים. אבל לפעמים ההיגיון הזה לא עובד. בעתיד, יישום טכנולוגיות רשת עצבית לזיהוי תמונות, Yandex, Google או כל מנוע חיפוש אחר יפיק תמונות המזוהות על ידי הרשת העצבית שעליהן בדיוק מחפשים. כלומר, מילות המפתח ייווצרו מהתמונה עצמה, ולא מהטקסט שלידה.

למעשה, עבור מחשב, מהי תמונה, מהו טקסט, אינה אלא קבוצה של בתים. רובוטים אנושיים, לפעמים כל כך טובים במענה לשאלות, פשוט פועלים עם תשובות שהוכנו מראש, כמו אדם ב"חדר סין ", ניסוי מחשבתי שהציע הפילוסוף האמריקאי ג'ון סירל. בלי לדעת את מהות השאלה, הרובוט, או ליתר דיוק, המחשב השולט בה, מבצע את ההוראה, לפיה הוא חייב לתת תשובה קבועה מראש לשאלה שנקבעה מראש. או, אם האדם לא הכין עבורו תשובה כזו, הפנו את ה"שיחה "הצידה על ידי מתן תשובה אוניברסלית שתתאים כמעט לכל שאלה. הרשת העצבית תאפשר ל"מוח "האלקטרוני של הרובוט" להבין "את משמעות המילים שמדבר בן השיח, כשם שמכלול הפיקסלים המרכיבים את התמונה, הרשת העצבית" מבינה "את מה שמתואר בה.
אם נחזור למנועי חיפוש, ראוי גם לומר כי Yandex אינה יודעת את משמעות הטקסטים שהיא מאנדקסת. רק הימצאותם של מה שמכונה "מילות מפתח" מאפשרת לך לקבוע את הרלוונטיות של הטקסט שנמצא ואת בקשת המשתמש.

רשתות עצביות יספקו ממשק טוב יותר לתקשורת עם המכונה. מנוע החיפוש יוכל לשאול שאלה ולקבל תשובה או סט הטקסטים הרלוונטיים ביותר מהאינטרנט. ניתן יהיה לתת פקודות לרובוט בשפה פשוטה. לדוגמה, בקשה להביא פטיש יכולה לבוא לידי ביטוי בדרכים רבות, תוך סידור מחדש של המילים, כפי שהשפה הרוסית מאפשרת זאת בלבד. והרובוט יבין אותך. למען האמת, רשתות עצביות הן הטכנולוגיות שיאפשרו לנו לקבל את מה שציפינו ממחשבים כל כך הרבה זמן: ראיית מכונה, הבנת דיבור אנושי, רחפנים לנהיגה עצמית, ועוד.
כיצד פועלות רשתות עצביות
אז בעצם איך פועלות רשתות עצביות? כל נוירון ברשת עושה כמות עבודה קטנה משלו. נוירונים מקובצים למספר שכבות עוקבות. אותות קלט (למשל, פיקסלים של תמונות) מגיעים לשכבה הראשונה של הנוירונים ועוברים ברצף דרך כל השכבות. מהראשון עד האחרון. נכון, ישנם גם מבנים שחוזרים על עצמם ומפיצים קבוצה מסוימת של אותות פנימיים ברשת. נתוני קלט חיצוניים עוברים את כל השכבות ברצף ובפלט כבר מוצגים כתוצאה מכך. רשתות עצביות מסוגלות להכליל נתונים ולמצוא בהם דפוסים. שינן את הממצאים והחל אותם בעבודה.
הוא האמין כי רשת עצבית מלאכותית מחקה את מבנה ותכונות מערכת העצבים של אורגניזמים חיים, או אפילו את המוח האנושי. בדומה למוח, רשתות עצביות מלאכותיות מורכבות מנוירונים רבים (אלמנטים חישוביים) המחוברים באמצעות סינפסות. עם זאת, יש הסבורים כי תכונות משותפות אלה בלבד אינן מספיקות, ולמעשה אין מעט מן המשותף בין עבודת רשתות עצביות מלאכותיות לבין המוח האנושי.

מהי עבודתו של נוירון מסוים? הכל קורה בצורה הבאה. קבוצה של אותות קלט מתקבלת בכניסה של נוירון, אותה היא מסכמת, ולאחר שיצרה אות פלט, שולחת אותה לנוירונים אחרים או לפלט הרשת. יש לציין כי הנוירונים של שכבת הקלט (הראשונה) של הרשת אינם מבצעים פעולות מתמטיות, מטרתם היא להכפיל אותות קלט ולהעביר אותם לנוירונים אחרים. האותות הנכנסים לנוירון מוכפלים במקדמים שצוינו (הם נקראים "משקולות"), ואז הם מסוכמים, והתוצאה המתקבלת מומרת באמצעות פונקציה מסוימת, ולאחר מכן מועברת לפלט.

בתכנית זו, נקודת המפתח היא בדיוק המשקולות. היכולת להתאים אישית את הרשת לפתרון בעיה ספציפית וגמישות המערכת נקבעים על ידם. אות הכניסה כפול המשקל הגבוה יותר גורם לתרומה גדולה יותר לסך הכל. אבל אם המשקל שווה לאפס, אז זה לא ייקח בחשבון.
מציאת המשקולות הנכונות עבור כל נוירון היא אימון הרשת. אותות נשלחים לנוירונים הקלטים של הרשת, שעבורם ידוע מראש למה הם מתאימים. אם הרשת מאומנת לזהות חתולים, אז אלה יהיו תמונות של חתולים וחתולים מגזעים וצבעים שונים. אם הרשת נותנת תשובה לא נכונה ביציאה, אז ערכי המשקולות משתנים. וכך הלאה עד שהרשת נותנת את התשובה הנכונה.

שים לב גם שרשתות עם מספר קטן של נוירונים לומדות מהר יותר, אך יחד עם זאת, לא תמיד הן מסוגלות לפתור בעיות מורכבות. לכן, בעת בניית רשת עצבית, חשוב לקבוע את מספר הנוירונים הנדרש ברשת. בנוסף, כדי שהאימון לא ייקח יותר מדי זמן, חשוב גם להגדיר את הערך ההתחלתי של המשקולות בהתחלה.
בנוסף לאימון רשת עצבית, אתה יכול גם להתאים אישית: לכלול נוירונים נוספים או אפילו שכבות חדשות של נוירונים ולהדיר נוירונים, שכבות או קשרים מיותרים ביניהם. זה מאפשר להתאים רשתות טוב יותר למשימות שלשמן הן נוצרות.
אך העניין אינו מוגבל לזיהוי תבניות. לא מזמן הבינה הבינה המלאכותית AlphaGo את אדון משחק הגו, לי סדול. בניגוד לשחמט, Go, שיש לו מספר עצום של עמדות אפשריות, לא רצה להיכנע למחשב. מחשב העל הכחול העמוק ניצח את אלוף העולם בשחמט, גארי קספרוב, בשנת 1997. הצלחתי לזכות ב- Go רק עכשיו. הרשת העצבית המורכבת מ -13 רמות הוכשרה למשחקים מקצועיים שנלקחו משרת KGS Go. בנוסף, בתהליך הלמידה שיחקה הרשת בתוכניות אחרות ובעותקים משלה.
העתיד שייך לרשת העצבית. מגמה זו לא תחלוף, שכן האופנה למשהו מעניין, אך בדרך כלל חסר תועלת, נעלמת. רשתות עצביות הן השלב הבא בפיתוח מערכות מחשוב. בקרוב הם יקיפו אותנו בכל מקום. אנו, באופן פיגורטיבי, מוצאים את עצמנו ברשתות עצביות.כפי שחובבים חובבים המתלהבים מההתפתחות שלהם, בעתיד נקרא פתקי חדשות שנכתבו על ידי הרשת העצבית ונאזין למוזיקה שהולחנה על ידה. התקשר עם עוזרי קול שיבינו אותנו הודות לטכנולוגיה זו, והשתמש בתרגום מכונה קולית באיכות גבוהה. רשתות עצביות ינבאו את מזג האוויר, ישלטו בכלי רכב בלתי מאוישים ובמל"טים צבאיים. ניתן ליישם אותן כמעט בכל תחום, וכאשר פותרים בעיות שבהן נדרש לעבד כמויות גדולות של נתונים, הן פשוט לא ניתנות להחלפה. מקצועות רבים, כולל מקצועות המסווגים כיצירתיים, אכן עשויים להיות בסכנה.
מספר גדל והולך של מפתחים עוסקים ברשתות עצביות. מספר רב של כלים ונתונים הופיעו ברשות הרבים. ציוד לבניית רשתות עצביות הפך לנגיש יותר. הטכנולוגיה הופכת לזמינה לא רק לתאגידים גדולים, אלא גם לכל מי שיודע לתכנת. בהתאם לכך, ישנם יותר ויותר שירותים המבוססים על טכנולוגיית רשת עצבית ומיועדים למשתמשים רגילים.

כך, למשל, אפליקציית Prisma תוך מספר ימים בלבד לקחה את ההובלה מבחינת מספר ההורדות ב- AppStore בעשר מדינות, כולל רוסיה. אפליקציה שנוצרה על ידי מפתחים רוסים, שכבר הופיעה ב- Google play, מאפשרת לך "לצייר מחדש" תמונה שצילמת, ולעצב אותה כך שייראה כמו ציור של אמן מפורסם. בארסנל היישומים נמצאים ואן גוך, פיקאסו, לויטאן, הוקוסאי וגאונים מוכרים אחרים. או האפליקציה הידועה לשמצה של FindFace, המאפשרת לך למצוא פרופיל של אדם ברשתות חברתיות מתמונה שצילמת לפני חמש דקות. לחיפוש, הוא משתמש בתמונות שלנו המתפרסמות ברשת החברתית VKontakte. אז בהחלט נכנסנו לרשתות עצביות.