Vývojáři umělé inteligence na africkém kontinentu čelí zásadní výzvě: jak trénovat modely, aby rozuměly a odpovídaly v místních jazycích, když neexistují téměř žádné psané zdroje k přečtení. Zatímco pro angličtinu existuje přes 7 milionů článků na Wikipedii, u většiny z odhadovaných 1500 až 3000 afrických jazyků je dostupnost dat minimální. Například tigriňa, kterou mluví asi 9 milionů lidí v Etiopii a Eritrei, má pouze 335 článků, a pro akan, nejpoužívanější rodný jazyk v Ghaně, není na Wikipedii žádný.
Z tisíců afrických jazyků je v současné době podporováno jen 42 jazykovými modely. Z 23 písem a abeced jsou k dispozici pouze tři – latinka, arabština a ge'ez (používané v Africkém rohu). Toto nedostatečné zastoupení pramení především z finančních důvodů. I když je mluvčích svahilštiny více než mluvčích finštiny, Finsko představuje lepší trh pro technologické giganty jako Google a Apple.
Chinasa T. Okolo, zakladatelka výzkumného institutu Technēculturǎ, varuje, že nedostatečný rozvoj jazykových modelů může mít pro Afriku katastrofální dopad, kdy budou lidé, kteří nehovoří některým z oněch 42 podporovaných jazyků, nadále vyloučeni z příležitostí. Pro rozvoj vlastní AI infrastruktury je proto nutné přehodnotit způsob vývoje modelů.
Profesor počítačových věd Vukosi Marivate z Pretoriiské univerzity vedl jihoafrickou část projektu African Next Voices. Tři týmy v Jihoafrické republice, Keni a Nigérii shromáždily za dva roky 9000 hodin audio nahrávek v 18 jazycích od mluvčích různého věku a z různých lokalit. Vytvořili tak datovou sadu, kterou mohou vývojáři AI využít k trénování modelů. V některých případech, jako u jazyka isindebele, bylo pro vytvoření podkladů pro nahrávky nutné použít vládní příručku pro pastevce koz, protože psaných zdrojů bylo k dispozici minimum.
Ačkoli African Next Voices neshromáždil dostatek dat pro trénování velkých jazykových modelů typu ChatGPT, zaměřili se na nahrávky týkající se klíčových témat, jako je zdravotnictví a zemědělství. Jak vysvětluje Nyalleng Moorosi, výzkumná pracovnice z institutu DAIR, malé, zaměřené datové sady mohou dosáhnout vysoké přesnosti v rámci specializovaného modelu. Podle ní je klíčové prioritizovat chyby. Zatímco chyby v modelech informujících o dění v centru Nairobi jsou tolerovatelné, chyby v bankovnictví nebo zdravotnictví mohou mít vážné důsledky.
Moorosi zdůrazňuje, že tvůrci AI musí chápat důsledky a kultury, aby pochopili váhu těchto chyb. Slova a symboly mají často mnoho významů; například kříž svatého Jiří je ve Spojeném království spojen s krajně pravicovou politikou, což není zřejmé někomu z Ghany. Nedostatek dokumentace a kontextuálního porozumění u jazyků s omezenými zdroji je velkým problémem. Studie DAIR například ukázala, že sociální média neodstranila nenávistné projevy související s etnickým násilím v Etiopii částečně proto, že systémy nebyly obeznámeny s místními slangovými výrazy.
Kromě nedostatku dat čelí afričtí vývojáři i problému s neukotveností mnoha afrických jazyků, které často postrádají kodifikaci ve formě slovníků nebo gramatik. Například pro jazyk kinyarwanda existují tři běžné způsoby psaní názvu země (uRwanda, Urwanda a u Rwanda), což komplikuje i základní zpracování textu. Další překážkou je nedostatek datových center.
Marivate se obává, že pokud se modely pro menší jazyky nevytvoří, tyto jazyky „zmizí“. Říká, že v případě jazyků, které nemají ani psací systém, se „model bude muset změnit“. Cílem by přitom mělo být zpřístupnění AI ve všech jazycích, a to i pro ty, kterými mluví jen jeden člověk. „Všechny jazyky si zaslouží zastoupení nebo zachování,“ dodává Moorosi.
Otázka územní příslušnosti Doněcké oblasti se stala hlavním bodem, který v současné době brání uzavření mírové dohody mezi Ukrajinou a Ruskem. Americký ministr zahraničí Marco Rubio tuto skutečnost potvrdil během středečního zasedání senátního výboru pro zahraniční vztahy. Podle jeho slov probíhají intenzivní diplomatické práce na tom, zda lze postoje obou stran v této věci vůbec nějakým způsobem sjednotit.
Válka na Ukrajině se dostala do fáze, kdy o úspěchu na bojišti rozhoduje především schopnost neustálé inovace bezpilotních prostředků. Rusko se v tomto ohledu stále více spoléhá na technologickou pomoc z Íránu, která mu umožňuje budovat rozsáhlou a neustále se vyvíjející flotilu dronů. Tato spolupráce vyústila v masivní produkci, která má Rusku zajistit převahu ve vzduchu i v době, kdy pozemní operace uvízly v opotřebovací válce.
Americká popová ikona Madonna vyvolala mezi svými ukrajinskými fanoušky vlnu rozhořčení poté, co se na sociálních sítích objevila v kontroverzním doplňku. Sedmašedesátiletá zpěvačka, která se dosud profilovala jako hlasitá podporovatelka Ukrajiny v boji proti ruské agresi, zveřejnila fotografie v sovětské beranici s rudou hvězdou. Tento krok vyvolal okamžitou kritiku, neboť mnozí považují používání sovětské symboliky za nevhodné a necitlivé vzhledem k probíhajícímu válečnému konfliktu.
Evropská unie oznámila plán vyčlenit 145 milionů eur na humanitární pomoc Ukrajině v reakci na kritickou situaci v zemi. Tyto prostředky mají zajistit základní potřeby, jako jsou přístřeší, potraviny, finanční pomoc a přístup k vodě či zdravotním službám. Součástí balíčku je také psychososociální podpora a asistence zaměřená na ochranu obyvatel, kteří čelí následkům ruských útoků na energetickou infrastrukturu.
Britský premiér Keir Starmer se během své návštěvy Číny setkal s tamním premiérem Li Čchiangem, aby projednali budoucí směřování vzájemných vztahů. Čínský premiér v úvodu jednání prohlásil, že lidé v obou zemích si přejí otevřenou spolupráci a vzájemný prospěch. Podle jeho slov jsou Starmerovy snahy o zlepšení vazeb široce vítány, což dokazuje společný zájem na stabilitě v neustále se měnícím světě.
Astronomové objevili novou potenciálně obyvatelnou planetu, která se nachází přibližně 146 světelných let od naší sluneční soustavy. Tento objekt, který dostal označení HD 137010 b, je svou velikostí velmi podobný Zemi a podle vědců vykazuje podmínky, které jsou v mnoha ohledech srovnatelné s planetou Mars.
Nové video ukazuje, co předcházelo zastřelení Alexe Prettiho federálními agenty. Muž se s nimi poprvé dostal do konfliktu již 11 dní před svou smrtí, potvrdila to i rodina. I tehdy měl u sebe zbraň, ale vůbec po ní nesahal. Agenti ho v prvním případě nechali jít.
Blíží se víkend na přelomu ledna a února, který bude poměrně mrazivý. Ani přes den se totiž teploty nemusí na řadě míst dostat nad nulu. Může také slabě sněžit, vyplývá z předpovědi Českého hydrometeorologického ústavu (ČHMÚ).
Českou politikou od úterního odpoledne otřásá kauza esemesek, jejichž prostřednictvím vyvíjel ministr zahraničí Petr Macinka (Motoristé) nátlak na prezidenta Petra Pavla ve věci jmenování Filipa Turka ministrem životního prostředí. Hlavy státu se veřejně zastala i první dáma Eva Pavlová.
Ivana Gottová měla v uplynulém lednovém týdnu kulaté padesáté narozeniny. Dlouho se nevědělo, jestli je vůbec nějak oslavila. Až v těchto dnech se objevily první informace o večírku, na kterém ale platila přísná pravidla.
Očekávání meteorologů z posledních dní se mají naplnit. V Česku bude ve čtvrtek na některých místech sněžit tak vydatně, že si to žádá výstrahu, kterou vydal Český hydrometeorologický ústav (ČHMÚ). Napadne až 10 centimetrů nového sněhu.
Šéf české diplomacie Petr Macinka (AUTO) se den po vyhrocení sporu s prezidentem Petrem Pavlem setkal s generálním tajemníkem NATO Markem Ruttem. Podle svých slov se s ním nakonec nebavil o aktuálním napětí mezi sebou a hlavou státu. Zdůraznil také, že je zcela na Česku, koho pošle na summit aliance.