ExplAInable

Tamir Nave, Mike Erlihson, Uri Goren, Hila Paz Herszfang

תמיר נווה, אורי גורן, מייק ארליכסון והילה פז הרשפנג מארחים מומחים מעולם הבינה המלאכותית. האזינו לשיחות עם חוקרי AI, דאטה סיינטסים, מהנדסי ML ומובילים בתעשייה, שמביאים לכם את האתגרים, המחשבות והתובנות המעניינות ביותר מבפנים.

  1. [148] עושים רוסט לסילבוס של הרווארד

    23H AGO

    [148] עושים רוסט לסילבוס של הרווארד

    אם למדתם את התואר השני שלכם לפני 2018, כנראה שהוא לא היה בדאטה סיינס.  אבל מאז, האקדמיות התחילו להציע לצד לימודי דיסיפלינות כמו מתמטיקה ומדמ״ח, גם תארים שניים מונחי מקצועות, ובניהם גם דאטה סיינס. והקולגות שלכם והאנשים שתנהלו שלמדו אחריכם? ייתכן מאוד שהם השתתפו בתארים כאלו. השבוע באקספליינבל, אורי והילה פתחו בלי פילטרים את 24 הקורסים שהילה בחרה במסגרת לימודיה בהרווארד. בדקנו איך כלכלה קפיטליסטית משפיעה על האיכות (והכמות) של קורסי בחירה, מהי החשיבות האקדמית בפקולטה לשילוב פרויקטים עם גופים ממשלתיים כמו נאס״א, מי הפרופסור שהוריד נקודות על קומיטים עמוסים מדי ב-GitHub, ולמה המרצים שלה חשבו שבניית קורס בUdemy מייצר דאטה סיינטיסטים יותר טובים.  הפרק המלא עכשיו בכל הערוצים, ואנחנו לא יכולים להבטיח שלא יהיו בחני פתע בהמשך.  אם עוד לא ראיתם את פרק 142, השקרים שUMAP מספר לנו - הנה הוא: https://open.spotify.com/episode/7JhkmVAchJCuJmBflJI6Vq?si=iabQasycRsa4DCVzIwYihw  פרק 136 על הורדת מימדים בלווינים של נאס״א עם מייק והילה: https://open.spotify.com/episode/5airSjSy665VXZ2tImf1vE?si=3-jAQ7JSTSCNoCFXPgbs0A  הסילבוסים של כל הקורסים מהתואר בData Science:  CSCI 29, Advanced Python for Data Science:  https://www.scribd.com/document/798907961/syllabus-15  CSCI 106, Data Modeling: https://harvard.simplesyllabus.com/en-US/doc/klanr3gi3  CSCI 109A, Introduction to Data Science: https://harvard-iacs.github.io/2020-CS109A/  CSCI E-82, Advanced Machine Learning, Data Mining, and Artificial Intelligencehttps://harvard.simplesyllabus.com/en-US/doc/87qroqsdw  CSCI E-88, Principles Of Big Data Processing: https://www.coursehero.com/file/30149735/BDP-Syllabus-Spring-2018pdf/  ISMT E-161, Computational Bayesian Inference: https://harvard.simplesyllabus.com/en-US/doc/mknirmekw  CSCI 89, Introduction to Deep Learning: https://harvard.simplesyllabus.com/en-US/doc/orl05sdoq  CSCI E-89b, Introduction to Natural Language Processing: https://harvard.simplesyllabus.com/en-US/doc/dy3xgo9om  ISMT E-136, Time Series Analysis with Python: https://harvard.simplesyllabus.com/en-US/doc/tn6vfy88u  MATH 156, Mathematical Statistics: https://harvard.simplesyllabus.com/en-US/doc/8zojz55h6  CSCI 597, Data Science Precapstone + CSCI E-599a Data Science Capstone: https://harvard.simplesyllabus.com/en-US/doc/xkxh8b79b  ספר של הילה עם פרופסור הנסטוק: https://www.amazon.com/Supercharged-Coding-GenAI-practices-Copilot/dp/1836645295 קורס של הילה ביודמי עם פרופסור גורלין:  https://www.udemy.com/course/apds-intro-to-advanced-python-for-mlops-and-data-science/?srsltid=AfmBOorNj_xL3x8JCmTXR3KDIgp01faF9uZryC8wFbpLw_fpcou1jyse  הספר Mathematical Statistics https://www.amazon.com/Mathematical-Statistics-Data-Analysis-Rice/dp/8131519546/ref=tmm_pap_swatch_0 00:00 תואר שני שני בהרווארד 01:01 מכלכלה קפיטליסטית של קורסי בחירה לארכיטקטורה של טרנספורמר במבחן אמצע 04:13 ארבע וחצי שנים לתואר שני אחד 6:48 חשיבות הארטיקולציה והפרזנטציה 09:47 פול סטאק דאטה סיינס 16:59 עוד קורסים במדמ״ח (או: כמה הילה קיבלה ברשתות תקשורת) 20:10 אז מה חסר ומה מיותר 23:59 הטיפים לדור העתיד

    26 min
  2. [142] השקרים שUMAP מספר לנו

    12/08/2025

    [142] השקרים שUMAP מספר לנו

    למה תמיד כשאנחנו משתמשים בUMAP, קלאסטרים עם אותה כמות נקודות נראים באותו הגודל? השבוע ב-explAInable, מייק והילה צללו לשיטת הויזואליזציה UMAP, שנחשבת לחדשנית ביותר בתחום ומשמשת רבים מאיתנו בהדמיה של נתונים ממימד הגבוה למרחב הטלה של דו-מימד (או תלת-מימד). ניתחנו את משמעות השם של השיטה, ובדקנו איך הנחת התפלגות האחידה שלנו המהווה את הבסיס להטלה במימד הנמוך יכולה לשבש לנו את התוצאות. האם אנחנו באמת יכולים לסמוך על צפיפות הנקודות במרחב ההטלה, האם יכול להיות שאנומליות ימסו לנו לקלאסטרים המרכזיים? כל זאת ועוד - בפרק! לינק לקוד הפתוח של UMAP, שכולל הטמעה של densMAP:  https://github.com/lmcinnes/umap לינק למאמר של UMAP בארכיב (עדכון אחרון של המאמר ב-2020): https://arxiv.org/abs/1802.03426 בואו להתארח אצלנו כמומחים בפרקים הבאים: https://forms.gle/JQM2zTmeY6cp58AA9 פרקים 00:00 מתי קווים מקבילים יפגשו? 00:51 היי UMAP, שמור לי על שכנים קרובים ונקודות רחוקות בבקשה! 02:26 החשיבות העסקית של ויז׳ואליזציות בעלות משמעות 03:19 עושים decoding לשם השיטה.  04:55 איך UMAP עובד מתמטית 07:54 אוי לא, הנחת ההתפלגות האחידה מסבכת אותנו! 08:46 האם הויזואליזציות שאנחנו מייצרים משקרות לנו? 11:00 שיפורים של UMAP להתמודדות עם צפיפות משתנה

    17 min

About

תמיר נווה, אורי גורן, מייק ארליכסון והילה פז הרשפנג מארחים מומחים מעולם הבינה המלאכותית. האזינו לשיחות עם חוקרי AI, דאטה סיינטסים, מהנדסי ML ומובילים בתעשייה, שמביאים לכם את האתגרים, המחשבות והתובנות המעניינות ביותר מבפנים.

You Might Also Like