Nagy István
Detecting Multiword Expressions and Named Entities in Natural Language Texts.
Doktori értekezés, Szegedi Tudományegyetem (2000-).
(2015)
(Kéziratban)
Előnézet |
PDF
(disszertáció)
Download (1MB) | Előnézet |
Előnézet |
PDF
(tézisfüzet)
Download (144kB) | Előnézet |
Előnézet |
PDF
(tézisfüzet)
Download (112kB) | Előnézet |
Előnézet |
PDF
(melléklet)
Download (3MB) | Előnézet |
Absztrakt (kivonat) idegen nyelven
Multiword expressions (MWEs) are lexical items that can be decomposed into single words and display lexical, syntactic, semantic, pragmatic and/or statistical idiosyncrasy (Sag et al., 2002; Kim, 2008; Calzolari et al., 2002). The proper treatment of multiword expressions such as rock ’n’ roll and make a decision is essential for many natural language process- ing (NLP) applications like information extraction and retrieval, terminology extraction and machine translation, and it is important to identify multiword expressions in context. For example, in machine translation we must know that MWEs form one semantic unit, hence their parts should not be translated separately. For this, multiword expressions should be identified first in the text to be translated. The chief aim of this thesis is to develop machine learning-based approaches for the auto- matic detection of different types of multiword expressions in English and Hungarian natural language texts. In our investigations, we pay attention to the characteristics of different types of multiword expressions such as nominal compounds, multiword named entities and light verb constructions, and we apply novel methods to identify MWEs in raw texts. In the thesis it will be demonstrated that nominal compounds and multiword named enti- ties may require a similar approach for their automatic detection as they behave in the same way from a linguistic point of view. Furthermore, it will be shown that the automatic detec- tion of light verb constructions can be carried out using two effective machine learning-based approaches.
Mű típusa: | Disszertáció (Doktori értekezés) |
---|---|
Publikációban használt név: | Nagy István |
Magyar cím: | Összetett kifejezések automatikus azonositása természetes nyelvū szövegekben |
Témavezető(k): | Témavezető neve Beosztás, tudományos fokozat, intézmény MTMT szerző azonosító Csirik János egyetemi tanár, DSc, SZTE TTIK Számítógépes Algoritmusok és Mesterséges Intelligencia Tanszék 10000477 Farkas Richárd adjunktus, PhD, SZTE TTIK Számítógépes Algoritmusok és Mesterséges Intelligencia Tanszék 10019075 |
Szakterület: | 01. Természettudományok > 01.02. Számítás- és információtudomány |
Doktori iskola: | Informatika Doktori Iskola |
Tudományterület / tudományág: | Műszaki tudományok > Informatikai tudományok |
Nyelv: | angol |
Védés dátuma: | 2015. november. 27. |
EPrint azonosító (ID): | 2434 |
A mű MTMT azonosítója: | 2758956 |
doi: | https://doi.org/10.14232/phd.2434 |
A feltöltés ideje: | 2014. okt. 20. 11:00 |
Utolsó módosítás: | 2020. ápr. 16. 09:44 |
Raktári szám: | B 5935 |
URI: | http://eprints.bibl.u-szeged.hu/id/eprint/2434 |
Védés állapota: | védett |
Actions (login required)
![]() |
Tétel nézet |