MÁLTÆKNISETUR

Rannsóknarsetur í máltækni


HUGBÚNAÐUR OG GAGNASÖFN

Hugbúnaður

Máltæknisetur og samstarfsmenn hafa þróað eftirfarandi frían og opinn hugbúnað:

  • Apertium-IceNLP. Grófþýðingarkerfi á milli íslensku og ensku, sem byggir á Apertium þýðingargrunninum og IceNLP (sjá hér að neðan). Apertium frumkóði og gögn er aðgengilegur á http://sourceforge.net/projects/apertium/. Frumgerð af Apertium-IceNLP kerfinu er aðgengileg.
  • IceNLP - safn málvinnslutóla til að greina íslenskan texta. Helstu einingar í IceNLP eru: tilreiðari, orðhlutafræðilegur greinir (IceMorphy), málfræðilegur reglumarkari, (IceTagger), þrístæðumarkari (TriTagger), hlutaþáttari (IceParser) og lemmald. IceNLP er aðgengilegt til niðurhals á http://icenlp.sourceforge.net/. Vefviðmót fyrir IceNLP er aðgengilegt.
  • CombiTagger - kerfi til að þróa og meta samtvinnaða markara. CombiTagger er aðgengilegt á http://combitagger.sourceforge.net/

Málleg gagnasöfn

  • Listi yfir málleg gagnasöfn er aðgengilegur hér.