Dołącz do nas na najbliższym spotkaniu: 20 maja o 18:00:00 - Zmiana Klimatu.
Poznaj prelegentów wydarzenia, zobacz agendę i sprawdź, co czeka na Ciebie!
Poznaj prelegentów, którzy podzielą się swoją wiedzą i doświadczeniem.
Kim jest prelegent?
Wojciech jest adiunktem w NASK - Państwowym Instytucie Badawczym w Warszawie, gdzie kieruje zespołem przetwarzania języka naturalnego (NLP). Jego prace koncentrują się na projektowaniu, trenowaniu i ewaluacji bezpiecznych oraz wiarygodnych systemów językowych. Obecnie prowadzi rozwój PLLuM - otwartego polskiego dużego modelu językowego, projektowanego z myślą o niezawodności, transparentności oraz zastosowaniach krytycznych, w tym w sektorze publicznym.
Stopień doktora uzyskał na Uniwersytecie Technicznym w Wiedniu. Jest częścią ELLIS Society , był stypendystą programu Marie Skłodowska-Curie w ramach projektu EU Horizon 2020 DoSSIER, a także wizytującym badaczem w University College London oraz University of Queensland.
O czym opowie?
Większość otwartych modeli wizyjno-językowych (VLM) jest trenowana głównie na danych anglojęzycznych, co ogranicza ich skuteczność w języku polskim. W ramach naszego projektu pokazujemy, jak zaadaptować tego typu model do nowego języka w sposób skalowalny i możliwy do wdrożenia - bez budowania kosztownych, ręcznie anotowanych zbiorów danych.
Bazujemy na podejściu LLaVA-Next i tworzymy automatyczny pipeline do tłumaczenia istniejących wielomodalnych zbiorów danych oraz ich filtrowania pod kątem jakości. Proces uzupełniamy o syntetyczne dane dla zadań OCR oraz przykładów bardziej zależnych od kontekstu kulturowego. Całość została zaprojektowana tak, aby wymagała minimalnej ingerencji manualnej i była łatwa do powtórzenia. Wyniki pokazują, że takie podejście jest skuteczne: nasz model LLaVA-PLLuM osiąga poprawę o 9,5% względem modelu bazowego na polskiej wersji benchmarku MMBench oraz lepszą jakość generowanych opisów obrazów w ocenie ludzkiej.
W prezentacji omawiamy pipeline, kluczowe decyzje inżynierskie oraz ograniczenia - zwłaszcza w obszarze jakości danych i pokrycia kulturowego. Pokazujemy też, jak te doświadczenia wpisują się w rozwój modeli w ramach PLLuM i mogą być wykorzystane w innych językach.
Nasi sponsorzy i partnerzy wspierający wydarzenie.