Close Menu
    Facebook X (Twitter) Instagram
    HUMANMAG
    • Dom
    • Nagłówki
    • Świat
    • Biznes
    • Nauka
    • Technika
    • Sport
    • Rozrywka
    HUMANMAG
    Home»Nauka»Naukowcy opracowują modele języka polskiego, możliwe polskie odpowiedniki GPT
    Nauka

    Naukowcy opracowują modele języka polskiego, możliwe polskie odpowiedniki GPT

    9 maja, 2024Brak komentarzy3 Mins Read
    Facebook Twitter Pinterest LinkedIn Reddit WhatsApp Email
    Naukowcy opracowują modele języka polskiego, możliwe polskie odpowiedniki GPT
    Share
    Facebook Twitter Pinterest Reddit WhatsApp Email

    Naukowcy z Politechniki Gdańskiej i OPI opracowali modele języka polskiego zwane Qra. To pierwszy odpowiednik otwartych narzędzi Meta czy Mistral AI na tę skalę. Qra lepiej rozumie polskie treści i lepiej potrafi tworzyć spójne teksty – podaje Politechnika Gdańska.

    Jak poinformowało biuro prasowe Politechniki Gdańskiej, uczelnia oraz Laboratorium AI Narodowego Instytutu Przetwarzania Informacji – Państwowego Instytutu Badawczego (OPI) opracowały generatywne modele języka neuronowego w języku polskim uczącego się wyłącznie na terabajcie danych tekstowych po polsku.

    „Qra jest pierwszą w swoim rodzaju i najlepszą w modelowaniu polskojęzycznego odpowiednika otwartych narzędzi, takich jak Meta czy Mistral AI. Qra lepiej rozumie treści w języku polskim, lepiej rozumie zadawane pytania i tworzy spójne teksty” – czytamy w oświadczeniu.

    Na Politechnice Gdańskiej w Centrum Kompetencyjnym IT STOS, jednym z najnowocześniejszych ośrodków informatycznych w tej części Europy, wyposażonym w superkomputer Kraken, stworzono środowisko obliczeniowe dedykowane do budowy modeli sztucznej inteligencji.

    Jak wynika z oświadczenia, w procesie wykorzystano klaster 21 kart graficznych NVidia A100 80 GB. Zespoły pracowały przez około sześć miesięcy nad przygotowaniem środowiska, stworzeniem narzędzi i modeli, szkoleniami (w oparciu o treści z takich dziedzin jak prawo, technologia, nauki społeczne, biomedycyna, religia czy sport) oraz testowaniem. „Dzięki bogatej infrastrukturze dostępnej w STOS faktyczny proces szkolenia najbardziej skomplikowanych modeli został skrócony z lat do około miesiąca” – podaje uczelnia.

    Współpraca Gdańsk Tech i OPI zaowocowała powstaniem trzech modeli o różnej złożoności tj. Qra 1B, Qra 7B, Qra 13B. Modele Qra 7B i Qra 13B osiągają znacznie lepszy wynik zakłopotania, czyli możliwości modelowania języka polskiego pod względem rozumienia, warstwy leksykalnej i gramatyki, niż oryginalne modele Llama-2-7b-hf (Meta) i Mistral-7B -v0.1 (Mistral-AI).

    Badania pomiaru zakłopotania przeprowadzono np. na zbiorze pierwszych 10 000 zdań zbioru testowego PolEval-2018, a modele dodatkowo przetestowano na zbiorze 5000 dłuższych i bardziej wymagających dokumentów napisanych w 2024 r.

    READ  Spektrum autyzmu analizowane przez sztuczną inteligencję, aby lepiej zrozumieć neuroróżnorodność

    Szablony Qra będą podstawą rozwiązań IT pozwalających uporać się z zagadnieniami i procesami wymagającymi lepszego zrozumienia języka polskiego.

    „Na tym etapie Qra jest podstawowym modelem językowym, który może generować poprawne gramatycznie i stylistycznie odpowiedzi w języku polskim. Tworzone treści są na bardzo wysokim poziomie, co może potwierdzić m.in. miara zakłopotania” – czytamy w oświadczeniu.

    Zespół rozpocznie prace nad dostrojeniem modeli, aby sprawdzić ich zdolność do klasyfikowania tekstu, podsumowywania go i odpowiadania na pytania.

    Nowe modele zostały opublikowane w dedykowanym repozytorium OPI-Gdańsk Tech na platformie huggingface. Każdy może pobrać szablon i dostosować go do swojego obszaru oraz problemów lub zadań, np. udzielania odpowiedzi. (PAPKA)

    godz./ bar/ kap/

    tr. RL

    Fundacja PAP umożliwia nieodpłatne przedrukowanie artykułów z portalu Nauka w Polsce pod warunkiem otrzymania raz w miesiącu wiadomości e-mail o korzystaniu z portalu i wskazaniu pochodzenia artykułu. Na stronach internetowych i portalach internetowych należy podawać adres: Źródło: www.scienceinpoland.pl, natomiast w czasopismach – adnotację: Źródło: Nauka w Polsce – www.scienceinpoland.pl. W przypadku serwisów społecznościowych prosimy o podanie jedynie tytułu i leadu przesyłki naszej agencji wraz z linkiem prowadzącym do tekstu artykułu na naszej stronie, a także na naszym profilu na Facebooku.

    Joanna Bator

    „Piwny maniak. Odkrywca. Nieuleczalny rozwiązywacz problemów. Podróżujący ninja. Pionier zombie. Amatorski twórca. Oddany orędownik mediów społecznościowych.”

    Share. Facebook Twitter Pinterest LinkedIn WhatsApp Reddit Email
    Previous ArticlePolska wzmacnia granicę z Białorusią, aby powstrzymać nielegalną migrację
    Next Article Nintendo ma dość płacenia Elonowi Muskowi za integrację z X

    Related Posts

    Wizyta szefa NASA w Polskiej Agencji Kosmicznej – POLSA

    30 lipca, 2024

    Polscy badacze badają, ile pestycydów spożywamy wraz z owocami

    30 lipca, 2024

    Pakistańsko-Polska Konferencja Naukowa „Stosunki Pakistan-Polska: wyzwania i szanse w zmieniającym się świecie” – Polska w Pakistanie

    30 lipca, 2024

    Polski naukowiec stawia sobie za cel walkę ze skażeniem Bałtyku

    29 lipca, 2024

    Rośnie liczba studentów zagranicznych w Polsce – wynika z nowego raportu

    29 lipca, 2024

    PPG przyznaje nagrody edukacyjne STEM uczniom szkół w Polsce

    29 lipca, 2024
    Add A Comment
    Leave A Reply Cancel Reply

    Navigate
    • Dom
    • Nagłówki
    • Świat
    • Biznes
    • Nauka
    • Technika
    • Sport
    • Rozrywka
    Pages
    • o nas
    • Formularz kontaktowy
    • DMCA
    • Polityka Redakcyjna
    • Polityka prywatności
    • o nas
    • Formularz kontaktowy
    • DMCA
    • Polityka Redakcyjna
    • Polityka prywatności
    © 2026 HumanMag. All rights reserved.

    Type above and press Enter to search. Press Esc to cancel.