Nejtěžší úkol, jakému kdy AI čelila: Dokáže se naučit africké jazyky? Vývojáři stojí před zásadním problémem

Ilustrační foto, foto: Pixabay

Klára Marková 12. prosince 2025 14:34

Sdílej:

Vývojáři umělé inteligence na africkém kontinentu čelí zásadní výzvě: jak trénovat modely, aby rozuměly a odpovídaly v místních jazycích, když neexistují téměř žádné psané zdroje k přečtení. Zatímco pro angličtinu existuje přes 7 milionů článků na Wikipedii, u většiny z odhadovaných 1500 až 3000 afrických jazyků je dostupnost dat minimální. Například tigriňa, kterou mluví asi 9 milionů lidí v Etiopii a Eritrei, má pouze 335 článků, a pro akan, nejpoužívanější rodný jazyk v Ghaně, není na Wikipedii žádný.

Z tisíců afrických jazyků je v současné době podporováno jen 42 jazykovými modely. Z 23 písem a abeced jsou k dispozici pouze tři – latinka, arabština a ge'ez (používané v Africkém rohu). Toto nedostatečné zastoupení pramení především z finančních důvodů. I když je mluvčích svahilštiny více než mluvčích finštiny, Finsko představuje lepší trh pro technologické giganty jako Google a Apple.

Chinasa T. Okolo, zakladatelka výzkumného institutu Technēculturǎ, varuje, že nedostatečný rozvoj jazykových modelů může mít pro Afriku katastrofální dopad, kdy budou lidé, kteří nehovoří některým z oněch 42 podporovaných jazyků, nadále vyloučeni z příležitostí. Pro rozvoj vlastní AI infrastruktury je proto nutné přehodnotit způsob vývoje modelů.

Profesor počítačových věd Vukosi Marivate z Pretoriiské univerzity vedl jihoafrickou část projektu African Next Voices. Tři týmy v Jihoafrické republice, Keni a Nigérii shromáždily za dva roky 9000 hodin audio nahrávek v 18 jazycích od mluvčích různého věku a z různých lokalit. Vytvořili tak datovou sadu, kterou mohou vývojáři AI využít k trénování modelů. V některých případech, jako u jazyka isindebele, bylo pro vytvoření podkladů pro nahrávky nutné použít vládní příručku pro pastevce koz, protože psaných zdrojů bylo k dispozici minimum.

Ačkoli African Next Voices neshromáždil dostatek dat pro trénování velkých jazykových modelů typu ChatGPT, zaměřili se na nahrávky týkající se klíčových témat, jako je zdravotnictví a zemědělství. Jak vysvětluje Nyalleng Moorosi, výzkumná pracovnice z institutu DAIR, malé, zaměřené datové sady mohou dosáhnout vysoké přesnosti v rámci specializovaného modelu. Podle ní je klíčové prioritizovat chyby. Zatímco chyby v modelech informujících o dění v centru Nairobi jsou tolerovatelné, chyby v bankovnictví nebo zdravotnictví mohou mít vážné důsledky.

Moorosi zdůrazňuje, že tvůrci AI musí chápat důsledky a kultury, aby pochopili váhu těchto chyb. Slova a symboly mají často mnoho významů; například kříž svatého Jiří je ve Spojeném království spojen s krajně pravicovou politikou, což není zřejmé někomu z Ghany. Nedostatek dokumentace a kontextuálního porozumění u jazyků s omezenými zdroji je velkým problémem. Studie DAIR například ukázala, že sociální média neodstranila nenávistné projevy související s etnickým násilím v Etiopii částečně proto, že systémy nebyly obeznámeny s místními slangovými výrazy.

Kromě nedostatku dat čelí afričtí vývojáři i problému s neukotveností mnoha afrických jazyků, které často postrádají kodifikaci ve formě slovníků nebo gramatik. Například pro jazyk kinyarwanda existují tři běžné způsoby psaní názvu země (uRwanda, Urwanda a u Rwanda), což komplikuje i základní zpracování textu. Další překážkou je nedostatek datových center.

Marivate se obává, že pokud se modely pro menší jazyky nevytvoří, tyto jazyky „zmizí“. Říká, že v případě jazyků, které nemají ani psací systém, se „model bude muset změnit“. Cílem by přitom mělo být zpřístupnění AI ve všech jazycích, a to i pro ty, kterými mluví jen jeden člověk. „Všechny jazyky si zaslouží zastoupení nebo zachování,“ dodává Moorosi.

Sdílej Sdílej

Témata:

umělá inteligence (AI) Afrika

Stalo se

Novinky

USA zjišťují, že bez pozemní operace Teherán nekapituluje. Írán získává navrch, obává se Bílý dům

Rozhodnutí amerického prezidenta Donalda Trumpa pozastavit třináctidenní letní bombardovací kampaň proti Íránu jasně ukazuje limity samotné vojenské síly. Přestože nálety způsobily obrovské škody a stály životy tisíců lidí, Teherán se nepodařilo přimět ke kapitulaci. Washington tak zjišťuje, že bez rozsáhlé pozemní operace, do níž se mu vůbec nechce, nedokáže své maximální požadavky prosadit.

Novinky

Americká armáda zmařila překvapivý raketový útok z Íránu, spojila síly se Saúdskou Arábií

Americká armáda zmařila překvapivý raketový útok z Íránu a spojila síly se Saúdskou Arábií k odvetným úderům na pozice proíránských milic v Íráku. K obnovení bojových akcí došlo poté, co Teherán odpálil sérii balistických střel namířených na americké vojenské základny na Blízkém východě, konkrétně v Jordánsku. Všechny íránské rakety byly podle amerického centrálního velení včas zachyceny a zničeny.

Novinky

Pentagon skrývá skutečná data? Údaje o počtu obětí války v Íránu nesedí, varuje CNN

Změny v evidenci obětí amerických vojáků v kontextu konfliktu s Íránem vyvolávají řadu otázek a pochybností. Když ministerstvo obrany před týdnem z oficiálního webu dočasně odstranilo údaje o čtyřech nedávno padlých vojácích, zdůvodňovalo tento krok pouhou technickou chybou a dočasným výpadkem systému. Vývoj posledních dnů ale podle CNN ukazuje, že šlo o daleko složitější proces. Reakce Pentagonu tak zapadá do širšího vzorce chování Trumpovy administrativy, která se opakovaně potýká s politicky citlivou tématikou vojenských ztrát.

Novinky

Dva biliony eur a tisíce nových úředníků? Návrh rozpočtu Evropské unie u Merze narazil

Německý spolkový kancléř Friedrich Merz rázně odmítl původní návrh rozpočtu Evropské unie, který v objemu téměř dvou bilionů eur předložila Evropská komise. Na společné tiskové konferenci s irským premiérem Micheálem Martinem v Dublinu prohlásil, že chystaný finanční plán je zcela nevyvážený a nepřijatelný. Merz zdůraznil, že Unie vyžaduje plošné škrty dosahující výše několika stovek miliard eur, aniž by však upřesnil, zda trvá na dříve zmiňované redukci ve výši čtyř set miliard eur.

Novinky

Izrael a Spojené státy zaútočily na Írán

Válka v Íránu na mrtvém bodě? Americká administrativa stojí před zásadním rozhodnutím

Spojené státy se v kontextu obnoveného vojenského konfliktu s Íránem znovu potýkají s iluzí takzvaného klamu utopených nákladů, který v minulosti opakovaně vedl k prodlužování neúspěšných zahraničních intervencí. Vstup do války se teheránským režimem se ukázal jako strategický omyl, neboť původních cílů, kterými bylo zamezení Íránu v získání jaderné zbraně a zničení jeho schopnosti projektovat sílu za hranice, nebylo dosaženo. Írán si podle webu National Interest stále udržuje sedmdesát procent své předválečné raketové kapacity, zatímco americká strana čelí vyčerpání zásob pokročilé munice a novým hospodářským tlakům na globálních energetických trzích.

Novinky

Protesty na Ukrajině nejsou jen o Fedorovi. Odhalují hlubší problém zakořeněný ve společnosti

Ukrajinský prezident Volodymyr Zelenskyj odvolal hlavního velitele ozbrojených sil Oleksandra Syrského, čímž vyvrcholil týden plný dramatických změn ve vedení ukrajinské armády i ministerstva obrany. K tomuto kroku došlo krátce poté, co z funkce odešel také ministr obrany Mychajlo Fedorov, který byl veřejností považován za hlavního architekta úspěšné ukrajinské strategie bezpilotních letounů.

Novinky

Indie jde stranou. USA mají v Asii nového stěžejního spojence

Spojené státy procházejí výraznou přehodnocovací fází své strategie v Tichomoří, v jejímž středu dochází k odsunutí Indie a naopak k upevnění pozice Japonska jako absolutně klíčového asijského spojence Washingtonu.

Novinky

Bublina, která splaskne? Hodnoty AI firem prudce rostou, realitě ale zdaleka neodpovídají, varuje ekonom

Globální finanční systém se může nacházet v bublině přehodnocení technologií umělé inteligence, která připomíná nemovitostní krizi z roku 2008. V rozhovoru pro server Politico na to upozornil generální tajemník Rady pro finanční stabilitu John Schindler. Reagoval tak na rekordní ocenění technologických společností a masivní příliv investic do odvětví umělé inteligence v posledních letech.

Novinky

Kde se invaze na Ukrajinu propojuje s válkou v Íránu? Oči světa se upírají ke Kaspickému moři

Kaspické moře se stává novým ohniskem globálního napětí. Největší vnitrozemské jezero světa totiž představuje pro Teherán i Moskvu zcela zásadní logistickou a obchodní tepnu. Význam této trasy dramaticky vzrostl v důsledku západních sankcí a námořních blokád v oblasti Perského i Ománského zálivu.

Novinky

Vězni čekající v největší íránské věznici na popravu zahájili protestní hladovku

V největší íránské věznici Ghezel Hesar nedaleko Teheránu došlo k dramatickému vyostření protestů proti vlně poprav. Nejméně 1 500 vězňů odsouzených k trestu smrti zde vstoupilo do hromadné hladovky, přičemž někteří z nich si na znamení odporu dokonce sešili rty nití. Vlna nespokojenosti vypukla poté, co úřady přeložily šest mužů odsouzených za drogové delikty na samotky, což obvykle předchází bezprostřednímu výkonu trestu.

Novinky

Netanjahu míří do jámy lvové? Na schůzce s Trumpem může dopadnout jako kdysi Zelenskyj

Přestože nadcházející schůzka mezi Donaldem Trumpem a Benjaminem Netanjahuem zapadá do dlouhé řady jejich vzájemných jednání, dosavadní osvědčený scénář plný vřelých gest se tentokrát opakovat nemusí. Vztahy obou státníků totiž od jejich posledního setkání v polovině zimy prošly znatelným ochlazením. Zatímco zpočátku americký prezident oceňoval společný postup vůči Íránu, protahující se konflikt a patová situace na Blízkém východě přinesly do vzájemné komunikace značnou frustraci i neobvykle ostrá slova.

Novinky

Ve Washingtonu začínají smuteční obřady na počest Grahama. Dorazil Netanjahu i Zelenskyj

Ve Washingtonu začínají dvoudenní smuteční obřady na počest zesnulého republikánského senátora Lindseyho Grahama. Mezi smutečními hosty nechybí izraelský premiér Benjamin Netanjahu ani ukrajinský prezident Volodymyr Zelenskyj. Oba lídři využijí svou přítomnost v americké metropoli také ke klíčovým jednáním s prezidentem Donaldem Trumpem v Bílém domě.

Proč se v horkém počasí nevyspíme? Vědci odpovídají a radí, co s tím

Tropické noci dokážou proměnit usínání v nekonečné trápení a samotná obava z nevyspání celou situaci ještě zhoršuje. Podle odborníků se psychický tlak spojený s nemožností usnout v horku rychle mění ve fyzickou i mentální zátěž. Lidé začnou sledovat hodiny, úzkostlivě počítají zbývající čas do budíku a snaží se usnout na sílu. Pokud nevlídné podmínky trvají několik nocí za sebou, akumulovaný spánkový dluh negativně ovlivňuje náladu, zvyšuje podrážděnost a snižuje schopnost čelit běžnému dennímu stresu.

Zaznamenali jste událost? Máte pro nás důležitou zprávu, příběh, fotografie, videa?

Nejtěžší úkol, jakému kdy AI čelila: Dokáže se naučit africké jazyky? Vývojáři stojí před zásadním problémem

USA zjišťují, že bez pozemní operace Teherán nekapituluje. Írán získává navrch, obává se Bílý dům

Americká armáda zmařila překvapivý raketový útok z Íránu, spojila síly se Saúdskou Arábií

Pentagon skrývá skutečná data? Údaje o počtu obětí války v Íránu nesedí, varuje CNN

Dva biliony eur a tisíce nových úředníků? Návrh rozpočtu Evropské unie u Merze narazil

Válka v Íránu na mrtvém bodě? Americká administrativa stojí před zásadním rozhodnutím

Protesty na Ukrajině nejsou jen o Fedorovi. Odhalují hlubší problém zakořeněný ve společnosti

Indie jde stranou. USA mají v Asii nového stěžejního spojence

Bublina, která splaskne? Hodnoty AI firem prudce rostou, realitě ale zdaleka neodpovídají, varuje ekonom

Kde se invaze na Ukrajinu propojuje s válkou v Íránu? Oči světa se upírají ke Kaspickému moři

Vězni čekající v největší íránské věznici na popravu zahájili protestní hladovku

Netanjahu míří do jámy lvové? Na schůzce s Trumpem může dopadnout jako kdysi Zelenskyj

Ve Washingtonu začínají smuteční obřady na počest Grahama. Dorazil Netanjahu i Zelenskyj

Proč se v horkém počasí nevyspíme? Vědci odpovídají a radí, co s tím

USA zjišťují, že bez pozemní operace Teherán nekapituluje. Írán získává navrch, obává se Bílý dům

Americká armáda zmařila překvapivý raketový útok z Íránu, spojila síly se Saúdskou Arábií

Pentagon skrývá skutečná data? Údaje o počtu obětí války v Íránu nesedí, varuje CNN

Dva biliony eur a tisíce nových úředníků? Návrh rozpočtu Evropské unie u Merze narazil