Duży model językowy (LLM)
Duży model językowy (ang. Large Language Model, LLM) — system sztucznej inteligencji trenowany na bardzo dużych zbiorach tekstowych, zdolny do generowania, analizowania i transformowania języka naturalnego.
Jak działa?
LLM działa na zasadzie przewidywania następnego tokenu (fragmentu tekstu) na podstawie kontekstu. Nie „rozumie" języka w ludzkim sensie — operuje na statystycznych wzorcach.
Przykłady
- GPT-4 (OpenAI) — model komercyjny, szeroko stosowany
- Claude (Anthropic) — model komercyjny, nacisk na bezpieczeństwo
- Llama (Meta) — model open-source
- Mistral (Mistral AI) — europejski model open-source
Ograniczenia
- Halucynacje — generowanie nieprawdziwych informacji
- Bias — reprodukowanie uprzedzeń z danych treningowych
- Brak ucieleśnienia — model nie ma zmysłowego doświadczenia świata
- Ślad środowiskowy — trening i użytkowanie zużywają dużo energii
W kontekście dramaturgicznym
LLM mogą służyć jako narzędzie pracy z tekstem — generowania wariantów, analizy struktury, badań kontekstowych. Zob. artykuł „Modele językowe dla dramaturgów".