Føroysk vitlíkismodell 2025: Hvørji eru tøk, hvussu væl rigga tey – og hvat kunnu tey brúkast til?

Føroyskt vitlíki 2025: Hvat riggar nú, hvar er fløskuhálsurin – og hvat eigur at mennast


1) Vit hyggja at:

Hetta er títt innlit í føroyskt vitlíki í 2025: Hvat finst, hvussu væl tað riggar í verki, og mín meining um, hvat vit eiga at raðfesta næstu 12 mánaðirnar. Vit hyggja at:

  • einum yvirliti yvir ymisku føroysku modellini og hvussu væl tey rigga (hoyr millum annað vitlíki tosa føroyskt),
  • eini greiðari strategi fyri tína fyritøku: Set EN til FO týðing og føroyska talu til tekst fremst,
  • hví dátur eru fløskuhálsurin — og hvussu vit fáa gongd á eitt føroyskt dátuinfrakervi.

Myndburðurin, vit brúka her, er einfaldur: modell eru sum hamarar og sagir. Men ein hamari byggir ikki eitt hús sjálvur — ein dugnaligur persónur við røttum amboðum og røttum arbeiðsgongdum byggir hús við hamara. Tí er tað eisini umráðandi at byggja vitlíkisamboð sum kunnu brúkast til veruligt arbeiði.

Verkstova image

2) Í stuttum

  • Vit hava longu eina fyrstu bylgju av føroyskum vitlíkisamboðum. Tey eru brúkilig til nógv ting — men ikki klár til at vera brúkað allataðni.
  • Fløskuhálsurin er dátur: Granskarar hava alt ov fáar føroyskar dátur at arbeiða við, og loyvini í hesum sambandi eru ofta ógreið. Hetta er ein infrakervisuppgáva sum onkur má fáa løn fyri at loysa.
  • Strategi nú: Raðfest enskt til føroyska týðing og føroyska talu til tekst (ASR) modell. Tey geva skjótast virði og leggja lunnar undir veruliga nýtslu av vitlíki á føroyskum.
  • Ikki jagstra eitt fullkomið føroyskt ChatGPT beint nú. Brúka heldur tað, vit hava (týðing + ASR) til smáar, álítandi loysnir — og fóðra skipanirnar við betri dátum.
  • Fyritøkur kunnu gott byrja at nýta vitlíki í dag: Men tú fært besta úrslitið um tú arbeiðir á enskum og bara týður til føroyskt tá ið tað er neyðugt. Hetta er óheppið fyri tað føroyska málið á arbeiðisplássinum.
  • Sjálvt um føroysku vitlíkisamboðini ikki eru klár til nakað kundavent, so kunnu fyritøkur spæla við føroyskt vitlíki til innanhýsis amboð, sum tildømis at avskriva reinar ljóðupptøkur á føroyskum ella geva innanhýsis amboðum eina føroyska rødd. (Tú kanst hoyra hvussu hetta ljóðar longur niðri!)

3) Yvirlit: Hvørji modell eru tøk í dag?

EN→FO týðing
🟨

Amboð at týða enskan tekst til føroyskt.

Modell: barbaroo/nllb_200_1.3B_en_fo

Styrkir

Skal ikki nýta sergjørt birt til at rigga væl. Lætt at koyra á egnan servara; ofta javnbjóðis ChatGPT‑4o.

Veikleikar

Slær ikki Gemini 2.5 Pro. Ikki púra líkatil at brúka fyri flest fólk.

Kann nýtast til

Týða alskyns enskar tekstir til føroyskt. Týða LLM‑úrslit til føroyskt.

ASR (talu→tekst)
🟨

Amboð at tosa á føroyskum og so verður talan umgjørd til tekst (avskriving).

Modell: Whisper-large (tillagað til føroyskt)

Styrkir

Reinar upptøkur vera til lesiligan tekst

Veikleikar

Óljóð ger skjótt at úrslitini verða væl vánaligari. Modellið kann ikki skilja hvær tosar, tá ið tvey tosa í senn.

Kann nýtast til

Notatir, skriva uttan at brúka hendurnar

TTS (tekst→talu)
🟨

Amboð at fáa eina rødd at tosa út frá teksti, sum ein koyrir inn.

Modell: Meta MMS TTS (fao)

Hoyr her hvussu tað ljóðar tá ið vitlíki ger føroyskan tekst til talu.

Styrkir

Klár og lætt skiljandi

Veikleikar

Mekanisk rødd, bara ein rødd

Kann nýtast til

Fráboðanir, innanhýsis amboð

Føroyskt LLM
🟥

Eitt sindur sum ein føroysk utgáva av ChatGPT.

Modell: gptfo_instruct_6.7B

Styrkir

Rættiliga lítið, kann koyrast á einum servara.

Veikleikar

Óstøðugt, klombrutt og ikki nóg gott til nakað veruligt arbeiði enn

Kann nýtast til

Gransking/royndir


4) Hvussu góð eru hesi modell so í verki?

🛠️ Enskt→ føroyskt (EN→ FO)

Hvussu tað riggar: enskan tekst in → føroyskan tekst út
Enskur tekstur fer inn og føroyskur tekstur kemur út.

Hví hetta modellið hevur týdning: Um ensk→føroysk týðing riggar væl, ber til at leggja hana oman á ChatGPT, Gemini ella onnur stór málmodell og at fáa úrslit á føroyskum, so tað kennist, sum um modellið heilt natúrliga tosar føroyskt. Sí mynd niðanfyri.

Dømi um hvussu ein kann nýta ein týðara saman við ChatGPT fyri at fáa svar at kennast føroysk
Dømi um hvussu ein kann nýta ein týðara saman við ChatGPT fyri at fáa svar at kennast føroysk.

Hvat er tøkt:

  • barbaroo/nllb_200_1.3B_en_fo: Lutfalsliga lítið samanborið við ChatGPT; kann koyrast á einum servara.

Úrslit: ofta javnbjóðis ChatGPT‑4o, men slær ikki Gemini 2.5 Pro.

Niðurstøða: 🟨 Brúkiligt amboð longu nú. nllb_200_1.3B_en_fo er eitt sterkt opið val, sum í mongum førum er á støði við ChatGPT‑4o.

Fyrimunir: Ein kann hýsa tað sjálvur, krevur ikki serstakt birt (prompt) og brúkar nógv minni orku enn tildømis Gemini 2.5 Pro.

Hvat er so best: Undir røttum umstøðum er Gemini 2.5 Pro best til føroyskt sambært mínum royndum; tó krevur tað eitt gott birt og tað kann ikki hýsast innanhýsis.

Tú kanst royna modellið her: https://huggingface.co/spaces/barbaroo/English-Faroese


🗣️ Føroysk tala til tekst (ASR)

Faroese speech goes in, text comes out
Føroysk tala fer inn, tekstur kemur út.

Hví hetta modellið hevur týdning: Tað kann hjálpa væl í uppgávum innan:

  1. Fundarsamandráttir: Har vitlíki skrivar alt niður, sum tosað verður um á einum fundi.
  2. At tosa við vitlíki: So ein kann samskifta við vitlíki í støðum har hendurnar ikki eru fríar.
  3. Skriviarbeiði: Tú tosar, vitlíki skrivar. Hetta kann spara tær nógva tíð á tínum fyrsta útkasti.

Bakgrund: Verkætlanarbólkurin Ravnur undir Grunninum Talutøkni bygdi BLARK 1.0 og savnaði inn meira enn 100 tímar av føroyskari talu til sonevnda Ravnursson-savnið. Við hesum dátum hava Carlos Daniel Hernández Mena (Reykjavík University / Language and Voice Lab) og Annika Simonsen (University of Iceland) tillagað Whisper-large til føroyskt mál.

Soleiðis riggar tað í dag:

  • Styrkir: Reinar og stillar upptøkur verða avskrivaðar til lesiligan tekstvið lutfalsliga fáum feilum.
  • Veikleikar: Óljóð, fólk sum tosa í munnin á hvørjum øðrum, málføri og fakmáleru framvegis ein avbjóðing.
  • Kann longu brúkast til: At avskriva tað sum ein einsamallur persónur sigur, tildømis ein framløga. Ella setast upp til eitt vitlíkismodell, so ein kann tosa við vitlíki.
  • Næsta stigið: Tørvur er á fleiri dátum: fjøltáttaðum ljóðupptøkum við røttum loyvum, betri tolsemi fyri óljóði og at skipanin skilir, hvør tosar.

Niðurstøða: 🟨 Ein sterk byrjan, og er longu brúkiligt at seta saman við vitlíkismodellum. Hent í skipaðum umhvørvi, men riggar ikki enn í óskipaðum umhvørvi, har fleiri tosa í senn.

Diagram of Faroese ASR setup
Dømi um hvussu modellið kann brúkast til at tosa við ChatGPT.

📣 Føroyskur tekstur til talu (TTS)

Faroese text to speech block
Føroyskur tekstur fer inn og føroysk tala kemur út.

Hví hetta hevur týdning: Gevur skipanum eina føroyska rødd til fráboðanir og hondfríða vitlíksnýtslu – og nógvar møguleikar fyri sjónveik.

Hvat vit hava: Meta MMS TTS (fao) — ein rødd, klár men mekanisk.

Hoyr eitt dømi um hvussu tað ljóðar:

Hóskar nú til: Fráboðanir til sjónveik og innanhýsis amboð til fyritøkur.

Næsta stigið: At gera tað meira veruleikakent og at fáa fleiri røddir sum tildømis eina kvinnurødd eisini.

Niðurstøða: 🟨 Brúkilig royndarútgáva. Hóskar væl til stutta talu frá skipanum; ikki til livandi upplestur ella kundavendar tænastur.


✍️ Føroyskt LLM (Føroyskt “ChatGPT”)

Hugskotið: gptfo_instruct_6.7B (Barbara Scalvini) tekur ímóti føroyskum boðum, t.d. “Ger hetta meira vinarligt”, og umskrivar tekstin.

Veruleikin: Riggar sum eitt konseptprógv, men úrslitini eru klombrutt og óstøðug. Sjálvt við góðum birtum megnar tað ikki at standa seg ímóti Gemini ella ChatGPT.

Hóskar nú til: Gransking og royndir.

Tørvur er á: Nógv meira av føroyskum teksti at venja við (dátatrupulleikin aftur!). Eisini er tørvur á meira gransking og royndum - hetta er ein torfør uppgáva.

Niðurstøða: 🟥 Á granskingarstigi, ikki klárt til nýtslu — og tað verður tað ikki uttan fleiri dátur.


5) Hvat kunnu fyritøkur gera í dag?

Amboð á byrjunarstigi kunnu gagna, um tey verða brúkt rætt.

✅ Tú kanst arbeið á enskum og týð seinni til føroyskt

Skriva uppkøst, legg til rættis og tak samanum á enskum við Copilot, Gemini ella ChatGPT. Týð síðani úrslitini til føroyskt, tá ið tað er neyðugt. Henda tvídeilda arbeiðsgongdin gevur tær størsta fyrimunin longu nú.

🗣️ Avskriva reinar ljóðupptøkur

Føroyska talu‑til‑tekst‑modellið (ASR) megnar hampuliga væl at avskriva reinar ljóðupptøkur við einum talara í senn. Brúka tað til at goyma notatir, framløgur og uppkøst – og rætta tekstin til aftaná. Hetta kann eisini setast saman við einum málmodelli sum tildømis ChatGPT, soleiðis at ein kann tosa við tað á føroyskum.

📣 Legg eina føroyska rødd afturat

Núverandi tekst‑til‑talu ljóðar eitt sindur mekaniskt, men er væl skiljandi. Tað hóskar væl til ymisk innanhýsis amboð í fyritøkuni ella til sjónveik.

Niðurstøðan: Tær tørvar ikki fullkomin amboð fyri at byrja. Við røttum birtum og einføldum arbeiðsgongdum kanst tú skapa gagnlig føroysk úrslit longu í dag.


6) Hvat skal raðfestast næstu 12 mánaðirnar

  1. Ein sterkur EN→FO týðari við nóg góðari góðsku at varðveita týdning og tónalag. Letur upp fyri føroyskum úrslitum, sum kennast natúrlig, bygd oman á altjóða stór málmodell. Samstundis: víðka føroyska dátugrundarlagið við meira tilfar og røttum loyvum. Men onkur má fáa løn fyri at gera hetta!
  2. ASR (tala→tekst), sum klárar ein vanligan fund. Amboðið má klára ymisk máldám, fólk sum tosa í munnin á hvørjum øðrum, og skrivstovuóljóð. Samstundis: savna fjølbroyttar, lógligar ljóðupptøkur við avskriftum; miðið eftir veruligum arbeiðstilburðum.
  3. Betri føroyskt TTS (tekst→talu) — fleiri týðiligar og natúrligar røddir. Samstundis: røkja úttaluorðabók.

Leggið til viks í løtuni: Eitt fullkomið føroyskt LLM. Hjálpið heldur vinnuni við amboðum, tey hava brúk fyri.


7) Dátur eru fløskuhálsurin – soleiðis loysa vit tað

Góðskan á vitlíki fylgir góðskuni á dátunum, ið vitlíki verður ment við. Okkum tørvar føroysk tekst‑ og ljóðsøvn við hágóðsku, breidd og røttum loyvum. Hetta er ein mál‑infrakervisuppgáva, ikki eitt frítíðarítriv — so onkur má fáa pengar fyri at arbeiða við hesum.

Hvat krevst nú:

  • Eitt greitt yvirlit yvir, hvørjar dátur finnast, og hvørji rættindi fylgja við.
  • Ein ætlan fyri, hvussu ein skjótast og snildast kann víðka savnið.
  • Lærdómar frá øðrum smámálslondum.
  • Fólk, sum verða lønt fyri at gera arbeiðið.

9) Ein tøkk skal ljóða

Hesi amboð eru til, tí onkur hevur gjørt tey. Takk til Barbaru Scalvini og toymið á Máltøknideplinum á Setrinum fyri føroyska máltøknimenningina; til Verkætlanarbólkin Ravnur undir Grunninum Talutøkni fyri BLARK 1.0; og til Carlos Daniel Hernández Mena (Language and Voice Lab, Háskólinn í Reykjavík) og Anniku Simonsen (Háskóli Íslands) fyri Ravnursson‑savnið og tillaging av Whisper‑large til føroyskt.

Um onkur viðurkenning vantar ella er skeiv, sigið mær frá — eg vil gjarna hava, at hetta er rætt.


10) Niðurstøður og endi (og hvat tit gera nú)

Niðurstøður:

  • Føroysku vitlíkismodellini eru amboð, sum vinnan kann nýta at byggja spennandi ting burturúr longu í dag.
  • Betri EN→FO týðing og talu-til-tekst-modell geva skjótast virði og leggja lunnar undir alt víðari arbeiði við vitlíki.
  • nllb_200_1.3B_en_fo er eitt sterkt, opin loyvir, men Gemini 2.5 Pro er best á natúrligum føroyskum.
  • Dátur (góðska, breidd og loyviviðurskifti) eru høvuðsforðingin í víðarimenningini av føroyskum vitlíki — og loysnin er eitt toymið við greiðum leiklutum og veruligari fígging, so fólk kunnu fáa løn fyri at loysa hesa forðing.

Vitlíkisstovan byggir ikki amboð. Vit byggja hús.

Um tykkara toymið vil royna eitt av hesum amboðunum — ella vil hava eina erliga meting av, hvat er vert at gera — so hjálpa vit fegin.