Biznes Myśli

Vladimir
Biznes Myśli

Szukasz sposobu na rozwój firmy z pomocą AI? Chcesz poprawić produkty i podejmować lepsze decyzje? Podcast "Biznes Myśli..." to Twoja dawka wiedzy o najnowszych trendach, praktycznych rozwiązaniach i inspirujących przykładach. Razem z ekspertami omawiamy kluczowe tematy AI: ludzie, pieniądze, trendy, pomysły, dane, narzędzia i sprawdzone praktyki. Biznes Myśli to Twoje sprawdzone źródło na temat sztucznej inteligencji. Świat zmienia się szybciej, niż myślisz – dołącz teraz! Blog: https://biznesmysli.pl/newsletter Youtube: 

  1. 6 DAYS AGO

    BM130: LangChain i wektorowe bazy: ciemna strona prototypowania AI

    Dzisiaj skupimy się na wdrażaniu AI na produkcję. Omówię trzy kluczowe kwestie: 1️⃣ Paradoks danych, zwykle zgadzamy się, że dane są ważne, ale często nie poświęcamy im tyle uwagi, ile potrzebują. 2️⃣ Przesadna koncentracja na narzędziach, owszem narzędzia są ważne, ale nie najważniejsze. 3️⃣ Cechy dobrego projektu na produkcję. Powinien być wiarygodny, kontrolowany, audytowalny i łatwy w naprawie błędów. Partnerem podcastu jest DataWorkshop - gdzie zajmują się praktycznym ML/AI. Na koniec odcinka też odpowiadam na pytania: Jakie są najczęstsze błędy firm, które próbują wdrożyć AI (główny mit)?Jakie są największe wyzwania związane z modelami LLM przy wdrażaniu je na produkcję?Jakie praktyczne wskazówki mam dla Ciebie, aby wdrożyć AI w swojej firmie?  Najważniejszym elementem udanego wdrożenia AI jest odpowiednie przygotowanie danych. To właśnie na poziomie danych wykonuje się 50-80% całej pracy. Kluczowe jest zadbanie o: Jakość danychOdpowiednią strukturyzację (np. w bazie danych lub systemie plików)Łatwość wyszukiwania potrzebnych informacjiMożliwość aktualizacji danychZarządzanie dostępami i uprawnieniami Powiem Ci trzy historie (projekty LLM), co najmniej trzy, będzie pewnie ich więcej, ale takie trzy przypadki użycia, w których wprost jako DataWorkshop jesteśmy teraz zaangażowani. Myślę, że to pobudzi Twoją wyobraźnię i lepiej zrozumiesz, co jest ważniejsze. Bo pamiętaj, że w większości przypadków są różne szacunki, 80%, 90%, nawet jeśli 50%, zwykle ML nie działa. Historia pierwsza - "Mentor" Organizacja zajmuje się mentoringiem w obszarze IT, skupiając się na wiedzy organizacyjnej, menedżerskiej i liderskiej. Obecnie zapraszani są eksperci, którzy prowadzą warsztaty. Są pewne wyzwania: ciężko jest to uspójnić, bo różni eksperci prezentują wiedzę w inny sposób i co jeszcze jest Trudności ze znalezieniem praktyków, bo znalezienie i zaangażowanie zapracowanych ekspertów jest trudne.Pojawił się pomysł, aby ocyfrować wiedzę i częściowo zautomatyzować mentoring przy pomocy AI. Czy to w ogóle możliwe? Historia druga - "Egzamin" Drugi projekt nazwijmy "Egzamin". W szkole zawodowej uczniowie zdają egzaminy, aby zdobyć kwalifikacje. Celem projektu jest stworzenie asystenta AI, który zdałby ten egzamin. Dlaczego to istotne? Zdając egzamin, asystent udowodniłby, że rozumie daną branżę. Można go by potem rozwijać, aby podpowiadał i prognozował. Klasyczne uczenie maszynowe i LLM mogą tu współdziałać. LLM może posiadać ogólną wiedzę zdobytą w procesie uczenia, a klasyczne algorytmy ML mogą prognozować wartości, np. popyt. Historia trzecia - "Helpdesk" Trzecia projekt nazwijmy "Helpdesk", projekt, w którym zachowanie poufności jest kluczowe. Nie mogę zdradzać szczegółów branży. W skrócie, chodzi o wykorzystanie LLM do stworzenia chatbota obsługującego bazę wiedzy i odpowiadającego na pytania użytkowników. Co znajdziesz w tym odcinku? 1️⃣ Paradoks danych – mówimy o ich znaczeniu, ale często zaniedbujemy realne działania na rzecz ich jakości. 2️⃣ Dlaczego 80-90% projektów ML nie trafia na produkcję? Poznaj najczęstsze błędy. 3️⃣ Trzy inspirujące przykłady z życia – mentoring z AI, egzamin z udziałem LLM oraz obsługa klienta wspomagana przez AI. 4️⃣ Kontrola i audytowalność – jak stworzyć projekt, który będzie skalowalny, zaufany i gotowy do poprawy błędów. 5️⃣ LLM i klasyczne ML – współpraca, a nie konkurencja. 6️⃣ Zadbaj o to, co naprawdę ważne!  7️⃣ Jeśli chcesz lepiej zrozumieć, jak skutecznie wdrażać modele ML w Twojej organizacji, nie przegap tego odcinka! 🎧 🔔 Subskrybuj i włącz powiadomienia - Twoja droga do praktycznego ML zaczyna się od jednego kliknięcia: YouTube https://www.youtube.com/@DataWorkshop?sub_confirmation=1 👍 Zostaw like, bo więcej lajków...

    1h 5m
  2. SEP 25

    BM129: Inferencja modele LLM: Mniej kosztów, więcej mocy

    Chcesz uruchomić modele LLM (np. Llama, Mistral czy Bielika) na własnych warunkach? W tym odcinku dowiesz się o sprzęcie, oprogramowaniu i trikach, które to ułatwią. Konkretna i praktyczna wiedza, która Ci się przyda.  Oglądaj na YouTube: https://youtu.be/_OKLzmaSmg0 🔔 Subskrybuj i włącz powiadomienia - Twoja droga do praktycznego ML zaczyna się od jednego kliknięcia: https://www.youtube.com/@DataWorkshop?sub_confirmation=1 👍 Zostaw like, bo więcej lajków = więcej praktycznych treści dla Ciebie! 💬 Co o tym myślisz? Zostaw komentarz! Masz pytanie? Zadaj je - chętnie odpowiem. 🤝 Poznajmy się lepiej! Zaproś mnie do swojej sieci na LinkedIn:  https://www.linkedin.com/in/vladimiralekseichenko/ 🔊 Zainicjuj rozmowę o ML w firmie, polecając ten podcast. Zainspiruj zespół do wdrażania ML! Poruszam też wątek GPT-4o: czy to rewolucja, czy ewolucja? I dlaczego OpenAI w tym modelu postawiło na inferencję oraz jak to jest powiązane z "rozważaniem". Podaję analogię, aby pobudzić Twoją wyobraźnię :). Do tego opowiadam jeszcze historię o Elon Musku, jak zorganizował serwerownię z 100 tysiącami kart H100 (+50 tysięcy) w około 4 miesiące, gdzie normalnie zajęłoby to co najmniej rok, i jakie napotkali wyzwania, poza samym zakupem kart GPU (wydał na nie ponad kilka miliardów dolarów). Dla porównania w Polsce na wszystkich uczelniach łącznie jest ok. 1 tys. H100. Pracując nad tym odcinkiem zrobiłem ​mapę myśli​, aby lepiej ustrektyryzwaoć wiedzę. Tu możesz je znaleźć. Łap! :) Można powiększać i klikać (część linków zostawiłem, chociaż przyznam, że to długi proces, ale uznałem, że może być wartościowy dla Ciebie).  🔥 https://mm.tt/app/map/3441826029?t=XESxGmZdR8  Pytania, na które znajdziesz odpowiedzi w tym odcinku: - Czym jest inferencja modeli LLM i jakie są kluczowe wymagania sprzętowe do jej przeprowadzenia? Jakie są dostępne opcje dostępu do mocy obliczeniowej potrzebnej do uruchamiania modeli AI i jakie są ich zalety oraz wady? - Jakie są główne różnice między zamkniętymi a otwartymi modelami AI i którzy są kluczowi gracze w tej dziedzinie? - Ile RAMu potrzebuje DUŻY model językowy i czy Twój komputer da radę? - Ile GPU trzeba mieć aby uruchomić Llame 8B, 70B czy nawet 400B? Jakie są najważniejsze parametry GPU i co one oznaczają w praktyce (tak po ludzku)? - Czy NVIDIA to JEDYNY wybór dla sprzętu? Poznaj alternatywy! - Czym jest kwantyzacja modeli LLM i jak wpływa na ich wydajność oraz precyzję? Partnerem podcastu jest DataWorkshop. Chcesz więcej? Zajrzyj do moich kursów online i ucz się ML i analizy danych w praktyce! 👉 DS/ML od podstaw - https://dataworkshop.eu/pl/practical-machine-learning 👉 Python - https://dataworkshop.eu/pl/intro-python 👉 Statystyka - https://dataworkshop.eu/statistics 👉 SQL - https://dataworkshop.eu/pl/sql 👉 Time Series - https://dataworkshop.eu/pl/time-series 👉 NLP - https://dataworkshop.eu/pl/nlp 🎧 Słuchaj BM wygodnie na Spotify, Apple Podcasts lub Google Podcasts: 📌 https://open.spotify.com/show/3ZUaHommHHZU6b4WJiyV2I 📌 https://podcasts.apple.com/us/podcast/biznes-myśli/id1215290277 📌 https://music.youtube.com/playlist?list=PLWOCRT27Z94XZzwcRI9-ExMyUXeBrF3W_

    1h 9m
  3. SEP 11

    BM128: Czy warto inwestować LLM? Czy w klasyczny ML?

    Czy sztuczna inteligencja zastąpi klasyczne uczenie maszynowe? Dowiedz się, jak skutecznie wykorzystać obie technologie w biznesie! ✔ Subskrybuj kanał: / https://www.youtube.com/@DataWorkshop?sub_confirmation=1 👍 Zostaw like! ❗Obserwuj mnie na LinkedIn https://www.linkedin.com/in/vladimiralekseichenko 📢 Poleć ten podcast znajomym zainteresowanym praktycznym wykorzystaniem AI w biznesie!  Przedstawiam różne perspektywy, dzieli się osobistymi doświadczeniami i analizuję, jak te technologie mogą wspierać decyzje biznesowe.  W tym odcinku dowiesz się: • Jakie są kluczowe różnice między LLM a klasycznym ML? • Kiedy warto inwestować w LLM, a kiedy lepiej stosować tradycyjne podejście? • Jak łączyć obie technologie dla uzyskania najlepszych rezultatów? • Jakie są praktyczne zastosowania LLM w biznesie? Najważniejsze tematy: 1. LLM (Large Language Models) i klasyczne uczenie maszynowe (ML) mają różne zastosowania i zalety - wybór między nimi powinien zależeć od charakteru problemu i dostępnych danych. 2. Klasyczne ML nadal wytwarza większą wartość w biznesie, szczególnie dla danych tabelarycznych, oferując lepszą jakość, szybkość i interpretowalność wyników. 3. LLM są przydatne do pracy z nieustrukturyzowanym tekstem, tworzenia baz wiedzy i wspomagania komunikacji między zespołami technicznymi a biznesowymi. 4. Najlepszym podejściem jest często łączenie klasycznego ML z LLM, wykorzystując zalety obu metod. 5. Wdrażanie i utrzymanie rozwiązań opartych na klasycznym ML jest zwykle prostsze i tańsze niż w przypadku LLM. 6. LLM nie zastępują całkowicie zespołu data science, ale mogą być cennym narzędziem wspomagającym, np. w generowaniu kodu czy dokumentacji. 7. Przy projektowaniu rozwiązań AI kluczowe jest zrozumienie problemu, skupienie się na stabilności i przewidywalności, a nie tylko na najnowszych narzędziach. Subskrybuj teraz i włącz dzwonek powiadomień, aby być dostawać praktyczną wiedzę o uczeniu maszynowym. Ten podcast to KONIECZNIE POZYCJA dla każdego, kto: - Interesuje się sztuczną inteligencją i jej zastosowaniami w biznesie - Rozważa wdrożenie LLM-ów lub klasycznego ML w swojej firmie - Chce być na bieżąco z najnowszymi trendami w AI Oglądaj na Youtube: https://youtu.be/TPDvcFeuoZ4 Autorskie kursy Vladimira: 👉 DS/ML od podstaw - https://dataworkshop.eu/pl/practical-machine-learning 👉 Python - https://dataworkshop.eu/pl/intro-python 👉 Statystyka - https://dataworkshop.eu/statistics 👉 SQL - https://dataworkshop.eu/pl/sql 👉 Time Series - https://dataworkshop.eu/pl/time-series 👉 NLP - https://dataworkshop.eu/pl/nlp 🔥 Chcesz uczyć się ML/DS w DataWorkshop?  Zarezerwuj indywidualną konsultację, aby doradzić najlepszą opcję dla Ciebie. https://dataworkshop.typeform.com/to/YCBMn37h Linki do podcastu: 📌  https://youtu.be/4pfEZuw3dtE 📌 https://biznesmysli.pl 📌 Apple Podcasts: https://podcasts.apple.com/us/podcast/biznes-myśli/id1215290277 📌 https://open.spotify.com/show/3ZUaHommHHZU6b4WJiyV2I 📌 Google Podcasts https://music.youtube.com/playlist?list=PLWOCRT27Z94XZzwcRI9-ExMyUXeBrF3W_ 📌 Spreaker: https://www.spreaker.com/podcast/biznes-mysli--2214604 #machinelearning #datascience #genai #llm #ml #ai

    59 min
  4. AUG 28

    BM127: Lokalne modele AI: Twoje dane, Twoje zasady

    Odkryj potęgę lokalnych modeli AI!  Uruchom je na swoim laptopie lub serwerze. Czytaj:  https://biznesmysli.pl/lokalne-modele-ai-twoje-dane-twoje-zasady ❗Obserwuj mnie na LinkedIn https://www.linkedin.com/in/vladimiralekseichenko ✔ Subskrybuj kanał:   / @DataWorkshop   👍 Zostaw like!  📢 Poleć ten podcast znajomym zainteresowanym praktycznym wykorzystaniem AI w biznesie! 🔑 Dowiesz się: - Jakie są zalety i wady korzystania z ChatGPT przez stronę internetową vs. API OpenAI lub chmury Azure. - Czym są modele lokalne, self-hosted, open source i offline oraz jakie dają możliwości. - Jakie narzędzia ułatwiają uruchamianie i dostosowywanie lokalnych modeli, np. Ollama, LM Studio, Jan.ai, llama.cpp, OpenWebUI. - Jak lokalne modele językowe wpływają na bezpieczeństwo i prywatność danych. - Jak wykorzystać lokalne modele do transkrypcji audio, analizy obrazu i innych zadań biznesowych. - Jakie są wyzwania i ograniczenia związane z korzystaniem z lokalnych modeli. 🔗 Wspomniane narzędzia - Ollama: https://ollama.com - LM Studio: https://lmstudio.ai - Jan.ai: https://jan.ai - OpenWebUI: https://openwebui.com - llama.cpp: https://github.com/ggerganov/llama.cpp - whisper.cpp: https://github.com/ggerganov/whisper.cpp 💬 Podziel się w komentarzach swoimi doświadczeniami z lokalnymi modelami AI. Jakie widzisz zastosowania w swoim biznesie? Słuchaj/czytaj na innych platformach: 📌 Spotify: https://open.spotify.com/show/3ZUaHommHHZU6b4WJiyV2I 📌 Google Podcasts https://music.youtube.com/playlist?list=PLWOCRT27Z94XZzwcRI9-ExMyUXeBrF3W_ 📌 Apple Podcasts https://podcasts.apple.com/us/podcast/biznes-myśli/id1215290277 📌 Spreker: https://www.spreaker.com/podcast/biznes-mysli--2214604 #llm #ai #machinelearning #llama #datascience #genai  🎙️ W tym odcinku: 0:32 - Wprowadzenie do świata LLM i ich biznesowego potencjału 5:48 - Publiczny ChatGPT vs bezpieczeństwo danych firmowych 11:46 - Rewolucja open source: modele Llama dorównują komercyjnym rozwiązaniom 17:15 - Ollama i LM Studio: narzędzia do lokalnego uruchamiania AI 24:51 - Jan.ai i trend małych modeli językowych 29:32 - Korzyści z lokalnych modeli AI: zgodność z GDPR i EU AI Act 35:35 - Whisper CPP: lokalna transkrypcja audio bez kompromisów 44:44 - Kontrola nad modelami AI: klucz do sukcesu w biznesie 49:08 - Phi 3.5 od Microsoft: mały model, wielkie możliwości

    51 min
  5. AUG 14

    BM126: RAG w LLM: Dlaczego popularne rozwiązania to droga donikąd?

    RAG w LLM: Dlaczego popularne rozwiązania to droga donikąd? Problem: Tradycyjne podejście do RAG (Retrieval-Augmented Generation) w dużych modelach językowych (LLM), choć obiecujące w teorii, często zawodzi w praktyce. Sztuczne dzielenie danych na fragmenty (chunki) prowadzi do utraty kontekstu i generowania niespójnych, a nawet błędnych odpowiedzi. Przyczyny: -- Mechaniczne dzielenie tekstu: Tradycyjne metody dzielą dane na chunki na podstawie liczby znaków, ignorując semantykę i kontekst. To prowadzi do utraty sensu i generowania chaotycznych odpowiedzi. - Nadmierne poleganie na embeddingu: Choć embedding jest potężnym narzędziem, nie jest rozwiązaniem idealnym. Nadmierne poleganie na nim prowadzi do wybierania fragmentów tekstu podobnych semantycznie, ale niekoniecznie istotnych dla danego zapytania. - Zaniedbanie jakości danych i struktury: Skupienie się na zaawansowanych algorytmach i bazach wektorowych odciąga uwagę od kluczowej kwestii - jakości i struktury danych. Skutki: - Niska dokładność i spójność odpowiedzi: Modele LLM generują różne odpowiedzi na to samo pytanie, a użytkownicy nie mają pewności co do ich poprawności. - Brak transparentności i audytowalności: Trudno jest prześledzić proces generowania odpowiedzi i zweryfikować, skąd pochodzą konkretne informacje. - Wysokie koszty implementacji i utrzymania: Zastosowanie złożonych architektur i modeli zwiększa koszty, a problemy z jakością danych prowadzą do ciągłych poprawek i reindeksowania. 🕒 Kluczowe momenty: 0:00 Wprowadzenie: RAG w LLM-ach 3:48 Generowanie trafnych odpowiedzi przez LLM-y 13:43 Odpowiedzialność za dane wejściowe 20:44 Problemy z mechanicznym podziałem tekstu 26:20 Osadzenie wektorowe i podobieństwo semantyczne 37:51 Alternatywne podejście do RAG 45:30 Ostrzeżenie przed nadmiernym komplikowaniem AI 53:00 Podsumowanie i alternatywne podejście 🧠 Dowiesz się: - Dlaczego klasyczne podejście do RAG często zawodzi - Jak LLM-y interpretują dostarczony kontekst - Jakie są pułapki przy implementacji RAG - Co to jest "mapa wiedzy" i jak może zrewolucjonizować AI Rozwiązanie: Należy odejść od mechanicznego podejścia do RAG i skupić się na: Głębokim zrozumieniu problemu biznesowego: Zdefiniowanie, co chcemy osiągnąć i jakie informacje są potrzebne do rozwiązania danego problemu. Manualnym zaprojektowaniu struktury danych: Ustalenie, w jaki sposób przechowywać dane, aby zachować ich sens i kontekst. Użyciu embeddingu jako narzędzia pomocniczego: Embedding powinien wspierać, a nie zastępować klasyczne metody wyszukiwania. Skoncentrowaniu się na jakości i aktualności danych: Zapewnienie, że dane są wiarygodne, aktualne i odpowiednio zabezpieczone. Korzyści: - Zwiększenie dokładności i spójności odpowiedzi. - Poprawa transparentności i audytowalności. - Obniżenie kosztów implementacji i utrzymania. - Spełnienie wymogów prawnych (GDPR, EU AI Act). Zamiast ślepo podążać za modnymi rozwiązaniami, należy skupić się na fundamentach - jakości danych, strukturze i zrozumieniu problemu biznesowego. Tylko takie podejście pozwoli wykorzystać pełen potencjał RAG i zbudować systemy oparte na LLM, które będą nie tylko efektowne, ale przede wszystkim efektywne. Jeśli interesujesz się przyszłością AI i jej praktycznym zastosowaniem w biznesie, ten odcinek jest obowiązkowy! 👍 Polub ten odcinek i podziel się przynajmniej z jedną osobą (poleć, warto). 🔗 Linki: https://biznesmysli.pl/rag-w-llm-dlaczego-popularne-rozwiazania-to-droga-donikad/  Obserwuj mi na LinkedIn (wysyłaj też śmiało zaproszenie): https://www.linkedin.com/in/vladimiralekseichenko/ 📢 Podziel się tym odcinkiem z kolegami i znajomymi zainteresowanymi AI i machine learning! Przydatne publikacji: -...

    59 min
  6. JUL 31

    BM125: Jak rozmawiać ze sztuczną inteligencją?

    🎙️ Gościem dzisiejszego odcinka jest Cezary Kujek, Product Manager w dziale Machine Learning Research w Allegro, specjalista od modeli generatywnych. Jedna z głównych myśli to, że umiejętność efektywnej komunikacji z modelami AI (prompt engineering) stanie się jedną z kluczowych kompetencji zawodowych, porównywalną do znajomości pakietu Office czy umiejętności posługiwania się mailem. Zwróć uwagę, że osobny zawód prompt engineering nie przetrwa na rynku biznesowym, ponieważ specjaliści w tej dziedzinie często nie posiadają wystarczającej wiedzy domenowej. Częściej bardziej opłaca się douczyć kogoś na miejscu do rozmowy z AI, niż w drugą stronę. Jest to efektywniejsze. Co ciekawe, korzystanie z AI nie sprawia, że człowiek przestaje myśleć (są też takie mity) - wręcz przeciwnie, uczy się nowych rzeczy i poszerza swoją wiedzę. AI to narzędzie, które pozwala nam szybciej się rozwijać i osiągać cele. Dlatego, ta umiejetność również dotyczy Ciebie! 🔥 Zapisz się na listę chętnych szkolenia: "Jak rozmawiać ze sztuczną inteligencją? Praktyczne podejście". Zdobądź nową praktyczną umiejętność:  https://bit.ly/3YqH2HD 💡 Dowiedz się: - Jak tworzyć efektywne prompty dla modeli AI - Jakie są kluczowe parametry modeli generatywnych - Jak oszacować koszty i czas wykorzystania AI w biznesie - Dlaczego prompt engineering to nowa kluczowa umiejętność zawodowa 🕒 Timecode: 0:00 - Wprowadzenie i przedstawienie gościa 5:02 - Jak rozmawiać ze sztuczną inteligencją? 13:44 - Kluczowe elementy dobrego prompta 17:18 - Tokeny i ich znaczenie w modelach AI 27:53 - Trójkąt tokenów: koszt, czas, rezultat 34:30 - Szacowanie kosztów wykorzystania AI w biznesie 40:34 - Parametry modeli AI - temperatura i topP 49:27 - Praktyczne zastosowania AI w codziennej pracy 55:21 - Dlaczego umiejętność korzystania z AI staje się kluczowa? 1:02:54 - Podsumowanie i pożegnanie 🔗 Przydatne linki Czytać: https://biznesmysli.pl/jak-rozmawiac-ze-sztuczna-inteligencja/ LinkedIn: - Vladimir: https://www.linkedin.com/in/vladimiralekseichenko - Cezary: https://www.linkedin.com/in/cezary-kuik - Publikacja RAG Does Not Work for Enterprises: https://arxiv.org/pdf/2406.04369 O czym jeszcze rozmawialiśmy: - Modele AI mają zdolność zamieniania nieustrukturyzowanych danych w ustrukturyzowane, co jest przydatne np. przy tworzeniu notatek ze spotkań. - AI może pomagać w upraszczaniu skomplikowanych tekstów technicznych na bardziej zrozumiałe. - Modele generatywne mogą wcielać się w różne role (np. prezesa firmy), zadając krytyczne pytania i pomagając ulepszyć dokumenty biznesowe. - Korzystanie z AI do generowania pomysłów i pytań może znacząco podnieść jakość pracy i dokumentów. - Modele generatywne AI, takie jak ChatGPT czy Claude, stały się niezbędnym narzędziem w codziennej pracy dla wielu osób. 📢 Poleć ten podcast znajomym, którzy interesują się AI i jej zastosowaniem w praktyce! #ai #sztucznainteligencja #promptengineering #genai #generativeai #machinelearning

    1h 7m
  7. JUL 17

    BM124: Jaki model AI wybrać: wyzwania i rozwiązania?

    Modeli LLM to aktualnie gorący temat. Aby efektywnie wdrożyć te modele w swojej firmie, konieczne jest stworzenie własnego leaderboardu, dopasowanego do konkretnych potrzeb biznesowych. Podpowiadam jak to zrobić, czyli od czego można zacząć (3 proste kroki). Choć istnieją zewnętrzne rozwiązania, to nie dają one pełnej kontroli i gwarancji trafności oceny. Warto czerpać z doświadczeń tradycyjnego ML, pamiętając jednak o zwiększonej złożoności procesu oceny LLM. ✅ Dlaczego wszystkie modele AI są błędne i jak to wpływa na biznes? 🤔 ✅ Dlaczego też nie ma idealnych modeli LLM i jak wybrać ten "wystarczająco dobry" do swoich potrzeb? ✅ Jak ewoluowały benchmarki i metryki oceny modeli NLP? ✅ Dlaczego tak popularne metryki, np. takie jak MMLU, tracą na znaczeniu? ✅ Czym jest ChatbotArena i Hard Arena - innowacyjne podejścia do oceny AI? ✅Jakie pułapki kryją się w korzystaniu z gotowych leaderboardów i na co uważać? ✅ Dlaczego warto stworzyć własny leaderboard  dopasowany do Twoich potrzeb biznesowych i jak to zrobić w 3 prostych krokach? ✅ Dodatkowe wskazówek i narzędzi, które ułatwią Ci ocenianie modeli LLM. Ten odcinek dostarczy Ci praktycznej wiedzy o tym, jak skutecznie oceniać i wybierać modele AI w praktyce. Tu możesz czytać: https://biznesmysli.pl/jaki-model-ai-wybrac-wyzwania-i-rozwiazania/ Zapraszam też LinkedIn: https://www.linkedin.com/in/vladimiralekseichenko/ Partnerem podcastu jest DataWorkshop. Zapraszam też na YouTube: https://youtu.be/eUIP2i0kxHo 👍 Polubić ten film 💬 Zostawić komentarz 📢 Udostępnić go znajomym, którzy mogą być zainteresowani Subskrybuj kanał "DataWorksohp", aby być na bieżąco z praktycznym ML/AI! 🔔 #ai #ml #leaderboard #benchmark #arena #llm #biznesmysli

    1h 11m
  8. JUL 3

    BM123:Fine-tuning LLM: fakty i mity

    🎙️ Czy zdarza Ci się zastanawiać, jak powstają zaawansowane modele AI, takie jak ChatGPT? Czy wiesz, że trening takiego modelu może kosztować tyle, co luksusowy apartament w Warszawie (a w skali GPT nawet znacznie więcej)? A może ciekawi Cię, ile czasu zajmuje przygotowanie dużego modelu językowego? No właśnie! Tym zajmiemy się w 123. odcinku podcastu "Biznes Myśli", gdzie zgłębiamy tajniki fine-tuningu modeli LLM! Ale przejdziemy krok po kroku, aby dojść do etapu fine-tuning. Gościem dzisiejszego odcinka jest Remigiusz Kinas, ekspert AI i członek core teamu projektu SpeakLeash. Rozmawiamy o faktach i mitach związanych z treningiem modeli językowych. Kawał wiedzy dla Ciebie. W tym odcinku koncentrujemy się na wyjaśnieniu kluczowych etapów trenowania modeli LLM, takich jak pre-training, fine-tuning oraz alignment, oraz na omówieniu ich zastosowań i wyzwań. Dowiesz się: Jak wygląda proces trenowania dużych modeli językowych od podstaw?Czym jest fine-tuning i kiedy warto go stosować? Jakie są kluczowe etapy tworzenia modeli AI i dlaczego dane są tak ważne? Jakie superkomputery są używane do trenowania AI i ile to kosztuje? Jak wygląda praca nad polskim modelem językowym Bielik 2.0?Zapraszam! 🕒 Najważniejsze fragmenty: 00:01:52 - Remigiusz Kinas przedstawia się i opowiada o swoim doświadczeniu z ML/AI 00:08:57 - Wyjaśnienie czym jest fine-tuning modeli na przykładzie Computer Vision 00:14:23 - Omówienie różnych rodzajów modeli językowych (pre-trained, instruct, fine-tuned) 00:30:00 - Czym jest T? Trilion czy bilion? 00:31:05 - Ile danych potrzebujemy? 00:43:53 - Cyfronet Helios, czyli na czym był trenowany Bielik?  00:47:15 - Ile kart GPU ma Meta (Facebook)? 00:27:34 - Dlaczego dane są najważniejsze w procesie trenowania modeli AI 00:53:00 - Ile kosztuje wytrenować model LLM? 00:58:32 - Czy warto robić fine-tuning?  01:09:07 - Co nowego w Bieliku 2? 01:24:42 - Podsumowanie Czytać: https://biznesmysli.pl/fine-tuning-llm-fakty-i-mity/ YouTube (ogłądać video): https://youtu.be/Kf55mex40-o LinkedIn: https://www.linkedin.com/in/remigiusz-kinas/https://www.linkedin.com/in/vladimiralekseichenko/ Inne linki: https://ai.meta.com/blog/meta-llama-3/https://opencsg.com/datasets/AIWizards/Alpaca-CoThttps://top500.org/lists/green500/list/2024/06/https://github.com/meta-llama/llama/blob/main/MODEL_CARD.mdhttps://github.com/NVIDIA/Megatron-LM https://github.com/hiyouga/LLaMA-Factoryhttps://arxiv.org/pdf/2406.06608https://github.com/vllm-project/vllm W podcaście omówiono: Rodzaje modeli LLM: - Model bazowy (pre-trained): Posiada ogromną wiedzę, ale nie potrafi prowadzić konwersacji - służy do przewidywania następnego słowa. - Model instrukcyjny (instruct): Potrafi wykonywać polecenia i prowadzić konwersacje. Powstaje poprzez fine-tuning modelu bazowego. - Model po alignmencie: Model instrukcyjny dodatkowo "wygładzony" i dostosowany do preferowanego stylu konwersacji. Fazy trenowania modelu: - Pre-training: Najważniejsza faza, w której model nabywa wiedzę. Wymaga ogromnych zbiorów danych i jest bardzo kosztowna (rzędu setek tysięcy dolarów). - Fine-tuning: Dostrajanie modelu do konkretnych zadań. Wymaga mniejszych zbiorów danych i jest tańszy od pre-trainu. - Alignment: Dopasowanie stylu i sposobu odpowiedzi modelu. Wymaga najmniej danych i jest najtańszy. Dane: - Pre-training: Dane tekstowe w ogromnej ilości (terabajty), im więcej, tym lepiej. Ważna jest jakość danych. - Fine-tuning: Instrukcje dla modelu (polecenia i przykładowe odpowiedzi) w ilości od tysięcy do milionów. - Alignment: Pary odpowiedzi (preferowana i odrzucona) w ilości kilku tysięcy. Koszty: -...

    1h 34m

Ratings & Reviews

5
out of 5
2 Ratings

About

Szukasz sposobu na rozwój firmy z pomocą AI? Chcesz poprawić produkty i podejmować lepsze decyzje? Podcast "Biznes Myśli..." to Twoja dawka wiedzy o najnowszych trendach, praktycznych rozwiązaniach i inspirujących przykładach. Razem z ekspertami omawiamy kluczowe tematy AI: ludzie, pieniądze, trendy, pomysły, dane, narzędzia i sprawdzone praktyki. Biznes Myśli to Twoje sprawdzone źródło na temat sztucznej inteligencji. Świat zmienia się szybciej, niż myślisz – dołącz teraz! Blog: https://biznesmysli.pl/newsletter Youtube: 

To listen to explicit episodes, sign in.

Stay up to date with this show

Sign in or sign up to follow shows, save episodes, and get the latest updates.

Select a country or region

Africa, Middle East, and India

Asia Pacific

Europe

Latin America and the Caribbean

The United States and Canada