Poziv na predavanje Računalno jezikoslovlje (Computational linguistics)

Odjel za matematiku Sveučilišta Josipa Jurja Strossmayera u Osijeku organizira predavanje Računalno jezikoslovlje (Computational linguistics)


NAJAVA – Predavanje će se održati u utorak, 11. rujna 2014. godine s početkom u 17 sati u predavaonici broj 36 na Odjelu za matematiku Sveučilišta Josipa Jurja Strossmayera u Osijeku (Trg Ljudevita Gaja 6).

Predavanje će održati:

  • prof. dr. sc. Mario Essert, Fakultet strojarstva i brodogradnje, Sveučilište u Zagrebu
  • dr. sc. Kristina Štrkalj Despot, Institut za hrvatski jezik i jezikoslovlje, Zagreb

Prema Rolandu Hausseru (Foundations of Computational Linguistics, Human-Computer Communication in Natural Language, Third Edition, Springer-Verlag, 2014.) tri su osnovna pristupa prirodnom jeziku:

  1. tradicionalna gramatika – koristi se metodom neformalne klasifikacije i opisa koji se temelje na tradiciji i iskustvu.
  2. teorijska lingvistika – koristi se metodama matematičke logike za opisivanje prirodnih jezika uz pomoć sustava formalnih pravila namijenjenog za dobivanje svih, ali samo gramatički ovjerenih, jezikoslovnih izraza,
  3. računalno jezikoslovlje – kombinira metode tradicijske gramatike i teorijske lingvistike s metodom učinkovite provjere eksplicitnih hipoteza, izvedbom formalnih gramatika kao učinkovitih računalnih programa i njihovim automatskim testiranjem na realnoj količini stvarnih podataka.

Unatoč različitim metodama, ciljevima i primjenama, sve tri varijante jezikoslovne znanosti dijele područje na jednake razine: na fonologiju, morfologiju (oblikoslovlje), leksikon (rječnik), sintaksu (skladnju), semantiku (značenje) i pragmatiku (područje primjene). Formalna teorija jezika (točke ii i iii) radi s matematičkim metodama koje obrađuju empirijski sadržaj gramatičke analize i funkcioniranje komunikacije što je moguće neutralnije – jezik postaje skup konačnih slijedova riječi (slobodni monoid).

S druge pak strane, budući da obradba prirodnog jezika (NLP) pripada području umjetne inteligencije (AI) i tradicionalne lingvistike, ona se bavi strukturom teksta i algoritmima koji izvlače smislenu informaciju iz teksta. Dobro poznata i učinkovita tehnika je model vektorskog¬¬¬¬ prostora, koji predočava dokumente kao matricu n × m dimenzija (Salton, Wong & Yang, 1975). Metrička udaljenost može se tako upotrijebiti kao funkcija matrice za izračunavanje sličnosti između dokumenata. Ova vrsta algoritama strojnog učenja potiče statistički pristup jeziku i povezana je s istraživačkim poljima poput rudarenja teksta, kategorizacije teksta i dohvaćanja informacije. Model vektorskoga prostora temelj je mnogim zadaćama u obradbi prirodnoga jezika i strojnoga učenja, od pretraživačkih upita do razvrstavanja tekstova i njihova grupiranja (klasterizacije).

Ovo predavanje predstavit će teorijske i praktične korake u procesu izvlačenja informacije iz sirovih podataka (npr. pronalaženje riječi i rečenica u nizu znakova), prepoznavanja i stvaranja vrste riječi (imenica, glagola, pridjeva itd.), prepoznavanja logičkih zakona u rečenicama te pronalaženja značenja iz odnosa među riječima. Na koncu, pokazat će se i neki programi s modelom vektorskog prostora u jezikoslovlju.

Uredio |2014-09-04T09:19:13+02:0004.09.2014.|Najave|

Kontakt podaci

SVEUČILIŠTE JOSIPA JURJA STROSSMAYERA U OSIJEKU Trg Svetog Trojstva 3 31000 Osijek Republika Hrvatska

Telefon: +385 31 224 102

Fax: +385 31 207 015

Web: UNIOS

Najnovije objave