Potwierdziły to badania Uniwersytetu Maryland i Microsoftu. Wynika z nich, że sztuczna inteligencja popełnia mniej błędów i trafniej analizuje informacje w języku polskim niż w angielskim czy francuskim. Zwłaszcza przy długich poleceniach. A im dłuższe polecenie dla AI, tym lepszy efekt.
Coraz bardziej zachwycam się polszczyzną
„Przeczytałam ostatnio ciekawostkę, że sztuczna inteligencja podobno najlepiej reaguje na polecenia wydawane po polsku. Serio.
Że polski jest jednym z najprecyzyjniejszych języków, z którymi AI potrafi współpracować.
Nie wiem, czy to prawda, czy kolejny internetowy mit, ale pomyślałam, że to świetny pretekst, żeby napisać o czymś, co często wraca w moich rozmowach i przemyśleniach (…) Z każdym rokiem coraz bardziej zachwycam się polszczyzną” – napisała na FB Paulina Młynarska.
Również naukowców – podkreśla Business Insider – polszczyzna zaskoczyła swoją wydajnością w kontekście sztucznej inteligencji.
W języku polskim popełniały mniej błędów
Że to nie mit – jak napisała Paulina Młynarska – pokazało wspomniane badanie. Naukowcy rozmawiali ze sztuczną inteligencją w 26 językach.
Modele popełniały mniej błędów, trafniej odpowiadały na zadania oraz lepiej analizowały duże zbiory dokumentów w języku polskim (88 proc.) niż w angielskim (83,9 proc.).
Drugie miejsce zajął język francuski (87 proc.),dalej włoski (86 proc.), hiszpański (85 proc.) i rosyjski (84 proc.).
Angielski z wynikiem 83,9 proc. uplasował się dopiero na szóstej pozycji, a chiński na czwartym miejscu od końca z wynikiem 62,1 proc. I to pomimo ogromnych zasobów danych używanych do trenowania modeli.
Dlaczego polski? Bo ma precyzyjną gramatykę
Zwycięstwo języka polskiego dotyczy – jak podaje Innpoland.pl – bardzo konkretnego zadania. Modele AI miały znaleźć i podać konkretne informacje ukryte w bardzo długich tekstach. Musiały też rozpoznać, kiedy w tekście brakowało konkretnej odpowiedzi na pytanie.
„Eksperymenty z otwartymi i zamkniętymi modelami LLM ujawniają rosnącą różnicę w wydajności między językami o niskich i wysokich zasobach, wraz ze wzrostem długości kontekstu z 8 tys. do 128 tys. tokenów.
Co zaskakujące, język angielski nie jest językiem o najwyższej wydajności w zadaniach długiego kontekstu (zajął 6 miejsce na 26), a na szczyt listy wysuwa się język polski" – czytamy w raporcie, który przytacza serwis Benchmark.pl.
Dlaczego sztuczna inteligencja upodobała sobie nasz język. Eksperci wskazują m.in. precyzyjną gramatykę, która minimalizuje ryzyko niejednoznaczności. To ułatwia sztucznej inteligencji analizę i wyciąganie trafnych wniosków z długich tekstów.
To odkrycie może mieć znaczenie dla rozwoju technologii AI w Polsce i na świecie.
Polski projekt pod nazwą PLLuM
To nie pierwsza sytuacja, w której język polski zyskuje uznanie w świecie sztucznej inteligencji – przypomina serwis spdersweb.pl. Niedawno polski rząd uruchomił projekt PLLuM. To pierwszy duży model językowy stworzony z myślą o języku polskim i zastosowaniach publicznych. Z tego rozwiązania korzysta już Częstochowa. Wykorzystuje je w pracy urzędów
Chatbot działający dzięki modelowi PLLuM pojawi się także w aplikacji mObywatel.







Komentarze