Polscy naukowcy opracowali generatywne neuronowe modele językowe na podstawie danych w języku polskim. Zdaniem twórców, jest to pierwszy i najlepszy w swojej kategorii odpowiednik otwartych narzędzi takich jak ChatGPT. Podstawową zaletą wynalazku znad Wisły jest to, że rozumie język polski o wiele lepiej niż modele powstałe za granicą.

Twórcami modelu są naukowcy z Politechniki Gdańskiej oraz AI Lab z Ośrodka Przetwarzania Informacji (OPI) – Państwowego Instytutu Badawczego. Opracowany wynalazek został nazwany Qra i utworzono go na bazie prawie dwóch terabajtów danych tekstowych wyłącznie w języku polskim. Jak dotąd jeszcze żaden zespół badawczy nie stworzył podobnego modelu opartego na tak gigantycznym zasobie polskich słów.

Model został opracowany w Centrum Kompetencji STOS, które jest jednym z najbardziej zaawansowanych centrów IT w Europie Środkowej. To tutaj chociażby znajduje się słynny superkomputer Kraken – czytamy w informacji Politechniki Gdańskiej. Dzięki niezwykle rozwiniętej technologii w CK STOS udało się wytrenować docelowy model w okresie zaledwie miesiąca.

Qra to pierwszy, zaawansowany model językowy oparty na danych wyłącznie w języku polskim

Warto dodać, że tak naprawdę Qra nie jest jednym modelem, a trzema. Nazywają się one kolejno Qra 1B, Qra 7B i Qra 13B. Dwa ostatnie wykazały najlepsze wyniki tzw. perplexity, czyli zdolności do modelowania języka w zakresie jego rozumienia, znajomości leksyki, gramatyki itd. Twórcy określają jakość Qra 7B i Qra 13B pod tym względem jako o wiele lepszą niż w popularnych i znanych modelach Llama i Mistral.

Do czego na razie może służyć wynalazek z Gdańska? Póki co nie został on jeszcze dostosowany do funkcji podobnych, jakie ma ChatGPT. Niemniej nie musimy się martwić. W tym momencie jest to przede wszystkim model językowy, który potrafi samodzielnie generować poprawne językowo i stylistycznie zdania po polsku.

Zespół badawczy informuje, że planuje kontynuować prace nad Qrą, aby dostosować ją do bardziej zaawansowanych zadań jak klasyfikacja tekstów, pisanie ich streszczeń czy odpowiadanie na pytania. W tym momencie wszystkie trzy modele są upublicznione i dostępne w repozytorium na platformie huggingface. Każdy z nas może pobrać sobie model i dostosować do swojej dziedziny – przekazano w komunikacie PG.

Źródło: fokus.com

Podobne wpisy