Feeds:
Entradas
Comentarios

Archive for the ‘IST’ Category

Lengoai Naturalaren Prozesamendua edo Human Language Technologies, ingelesez, kotzeptura hurbiltzeko zenbait definizio eta azalpen emango ditugu. Definizio horiek, nahiz eta euren artean ezberdinak izan, kontutan hartu behar dugu kontzeptu berbera azaltzen dutela, eta beraz, antzekotasunak izango dituztela. Hona hemen hiru definizio eta azlpen:

1. Hizkuntzaren tratamendu automatikoaren ikerlerroari lengoaia naturalaren prozesamendua (LNP) esaten diote informatikariek, nahiz eta batzuetan, hizkuntzalaritzaren ikuspuntutik erreparatuta, linguistika konputazionala ere esan. Hizkuntza industria oso bat sortzen ari da, konputagailuaz baliatuz hizkuntza prozesatzea helburu duena. Hala ere, ezinbestekoa da jakintza izatea eta egotea informatikari eta hizkuntzalarien formazioa ona eta taldekoa izan dadin.

2. Lengoai naturalaren prozesamendua (LNP) Informatika eta Linguistikaren azpi-atal bat dugu. Gizakien arteko komunikazioa edota hauek makinekin duten lengoaia naturalaren bitartez, bere baitan hartzen duen programen aplikazioak eta informatika tekniken multzoa da. Atal honekin erlazionaturiko aplikazioak hauexek dira:

– Itzulpen automatikoa                                                                                                                                                                                                   – Akats ortografikoen zuzenketa                                                                                                                                                                                  – Galderei erantzuteak                                                                                                                                                                                                     – Ahotsaren sintexia                                                                                                                                                                                                        – Lengoaia ulertzea                                                                                                                                                                                                            – Testuetatik informazioa berreskuratzea eta ateratzea                                                                                                                                    – Testuen belaunaldi automatizatua

3. LNP-a, ordenagailuekin komunikatzeko lengoaia naturalari deitzen zaio, hau da, makinei mezuak bidaltzen zaizkietenean eta ulertzen dituztenean gertatzen den prozesuari. Lengoai naturalaren erabilerak lengoaiarekin erlazionaturiko programen  garapena errazten dute eta, lengoaiarekin erlazionatutako giza mekanismoak ulertzen lagunduko duten ereduak garatzen dituzte.

Hiru definizio horiek behin irakurrita eta ulertuta argi geratzen da makinen eta lengoai naturalarekin erlazionatuta dagoen prozesua dela  LNP.

Iturriak :

Read Full Post »

Hurrengo hauek dira giza lengoaia teknologiako zentroek ikertzen dituzten hainbat atala:

  1.  Itzulpengintza automatikoa
  2.  Web semantikoa
  3.  Openphone
  4.  Parsing-a eta tagging-a
  5.  Lengoaia naturalaren prozesamendua
  6. Adimen artifiziala
  7. Plataforma eleanitza
  8. Hizlarien etaa lengoaiaren identifikazioa
  9. Linguistika konputazionala eta lengoaiaren teknologiarako aplikazioak
  10. Informazio kognitiboaren prozesamendua

ITURRIAK:

  • Human Language Technologies (HLT). Sociedad Española Para el Procesamiento del Lenguaje Natural. 2009ko maiatzaren 30ean hartuta, 14.10etan. Orrialdea: http://www.sepln.org/
  • International, European and National projects concerned with Language Technology (2009). Language Technology Word-en. 2009ko maiatzaren 30ean hartuta. Orrialdea: http://www.lt-world.org/
  • The Stanford Natural Language Processing Group, Stanford. 2009ko maiatzaren 30ean hartuta. Orrialdea: http://nlp.stanford.edu/research.shtml
  • Language Technology Documentation Centre, Finland (2008, urriak 1). Projects. 2009ko maiatzaren 30ean hartuta, orrialdea:  https://kitwiki.csc.fi/twiki/bin/view/FiLT/ProjectsEn 

Read Full Post »

Galdera erantzun sistema batek informazioaren hustuketaz eta hizkuntz naturalaren prozesamenduaz baliatzen da, erantzun zehatzak, dokumentu askoren artean topatu eta emateko. Horretarako sistemak, galdera moduan ematen den sarrera bat behar du, osteratzean, erantzun konkretu bat eman ahal izateko.

Erantzunak prozesatzeko ekintzak kontu handiz eta ahalik eta era naturalean burutu behar dira, kasu batzuetan,  hustuketa sinpleak baino ez direlako ( adibidez: galderaren erantzuna izen bat, kantitate bat edota data bat denean) eta beste batzutan, ordea, dokumentu anintzen arrapostu partzialak konbintzen direlako eta tekniken beharra egoten delako.

Hala ere, galdera bati erantzuna eman aitzin, beharrezkoa da ezagutzea zer nolako jakintza iturri dauden gure eskura. Bwhar dugun erantzuna jakintza iturri haietan ez baldin badago kontuz ibiltzeko, erantzun zuzena ez aurkitzea gerta litekelako.

Gaur egun, argi dago galdera-erantzun sistema aurreratuenak ingelez ematen direla, baina, badaude euskaraz lantzen hasi diren lehenengo prototipoak, hala nola, UZEI Euskal Term.

 

ITURRIAK:

Read Full Post »

Artikulu honetan, linguitika informatikoa aztertzen eta lantzen duten bi elkarte aurkeztuko ditut:

1. Lehenik eta behin, Espainiako elkarte baten proiektuak eta eskaintzak zeintzuk eta nolakoak diren azalduko ditut. Sociedad Española para el Procesamiento del Lenguaje Natural izena du lan talde honek. Hainbat soziok eta instituziok eratutakoa da eta lengoaiaren prozesamenduaz arduratzen da.

Urtero legez, kongresu bat antolatzen dute eta, bertan, lengoaiaren prozesamenduan diharduten estatuko elkarteak biltzen dira. Madrilen burutzen da kongresua, eta hainbat erabaki hartzen dituzte datorkien urtean funtzionamenduan jartzeko. Elkartearen web orrian zerrendaturik agertzen dira urteko kongresuan eztabaidatuko diren gaiak. Normalean hauek dira esanguratsuenak: itzulpengintza automatikoa, anbigutasuna saihestea eta testuen edukiaren analisia egitea.

Web orrialdearen helbidea: http://basesdatos.uc3m.es/sepln2008/web/

 

2. Bigarrenez, National Centre for Language Technologies Irlandar ikerkuntza zentrua daukagu, zeinaren aburuz, hizkuntza da komunikazio gertatu ahal izateko gakoa edo giltza. Hori dela eta, giza baliabideak konputuekiko elkarreraginean uztartzea dute helburu. Gauzak horrela, zentru teknologiko hau hizkuntzen itzulpengintzan eta batasunean zentratu eta hainbat makina sortu dituzte hauek merkaturatzeko.

Aipagarriak dira ordura arte zentruak merkaturatutakoak. Izan ere, ordenagailuetarako programa itzultzaileak, DVD-etako azpitituluen itzulpenetarako zuzentzaileak, hainbat hizkuntzetako gramatikako irakaspenetarako programak, konputu eta ahotsen arteko elkarreragina uztartzen dituzten programak eta abar, eskaintzen dituzte.

 ITURRIAK:

Read Full Post »

Bigarren galdeketarekin jarraituz ikerkuntza gai baten azalpena egingo dut artikulu honetan zehar: IXA taldea.

Euskal Herriko Unibertsitateko Informatika Fakultateko IXA taldea aztertzea erabaki dut. Izan ere, gertuko ikerkuntza taldea izanik, aurrera daramatzaten proiektuak eta beraien xedeak zeintzuk diren aztertzea interesgarria delakoan nago.

IXA taldeak, 14 hizkuntzalari eta 31 informatikari osatuta dagoen EHU-ko informatika faultatean sortutako taldeak, Lengoaia Naturalaren Prozesamenduren gaineko ikerketak burutzen ditu. Hala ere, esan daiteke, IXA,  “euskararen gaineko ikerketaz” arduratzen dela. Ikerketa hauek aurrera eraman ahal izaten ditu IXA-k hainbat enpresa pribatu eta publikoen babesa jasotzen duelako: Microsoft, Eatoni, Eleka, Elhuyar, UZEI, Euskaltzaindia, Plazagune, Berria………………

 

IXA-k burutzen dituen ikerketak, azpikategoria hauetan sailka daitezke: 

  1. Itzulpen automatikoa
  2. Hizkuntzaren tratamendua
  3. Informazioaren berreskurapena eta errauzketa
  4. Hizkuntza tresnen integrazioa
  5. Oinarrizko baliabideak
  6. Morfologia
  7. Sintaxi Morfosintaktikoa
  8. Hizkuntzen ikasketa

Bakoitzaren barruan beste atal desberdinak jorratzen dira baina nik hiru hauek aukeratu ditut: XUXEN, Elhuyar-Word hiztegi sistema eta BertsolariXA sistema.

Ezaguna da, XUXEN egiaztatzaile ortografikoa. Bertan, euskaraz idatzitako testuetan ageri diren akats ortografikoak zuzendu eta egokitzeaz arduratzen den zuzentzailea da. Hasiera batean, ordenagailuan instalatu beharra zegoen, egun, aldiz,  http://ixa.si.ehu.es/Ixa helbidean eskuragarri dago zerbitzua.

Bestalde, ordenagailuekin lanean gabiltzalarik, oso lagungarria suerta dakiguke Elhuyar-Word hiztegi sistema. Honekin, bai euskarazko zein gaztelerazko hitzen esanahi eta itzulpenak segituan ikus ditzakegu. Horrela, ele biak bizkor maneiatzea aise egiten da.

Kuriosoa da baita ere, IXAk bertsolaritzari eskainitako proiektua; BertsolariXa du izena eta “bukaera bat emanda, errimak aurkitzen ditu”. Helbidea: http://ixa.si.ehu.es/Ixa/Produktuak/1039000805.

ITURRIAK:

Read Full Post »

IKERTZAILEAK (1.galdeketa)

Artikulu honen bidez Martin Kay eta Yorick Wills-en biografriak narratuko ditut, ikasgai ditugun gaietan pertsonai garrantzitsuak direlako:

Martin Kay ordenagailu zientzian lizentziatua, ordenagailuekin harremandutako linguistika gaien gainean Staford eta Saarland unibertsitateetan egin zituen ikerketengatik dugu ezaguna. Britania Handian jaio, hezi eta hazi zen.

1958. urtean Cambridge-ko lengoaiaren ikerketa sailean sartu eta hiru urteren buruan, M.A titulazioa Trinity Collegen (Cambridge) jaso zuen. Geroxeago, 1972.urtean, Rand Corporation-en zeukan  buruzagi lana utzi zuen eta Californiako Ordenagailu Zientzien Fakultatera lekualdatu zen, non, katedra jaso eta gaur egun ordenagailuekin loturiko linguistikaren sailean irakaslea da.

Martin, ordenagailuekin lotutako linguistika eta makinen itzulpenean aintzindari izan denez gero, linguistikan, unifikazioaren nozioa barneratu du.

Yorick Wills ikertzaile ingelesa da. Gure artean ezaguna dugu adimen artifiziala dela eta. Adimen artifizial hura makinen inteligentziari egiten die erreferentzia. Yorick, bere liburuetan, adituen ikasketa eta diseinu bezala definitzen du adimen artifiziala. Europar eta Amerikar elkarteengatik aukeratua izan da Adimen artifiziala arlorako 1970.urtean izan zuen ekarpenagatik, “Presentzia Semantikoa” izenarekin ezagutzen dena.

ITURRIAK:

Read Full Post »

Artikulu honetan machine translation, machine aided translation, multilingual content management eta translation technology kontzeptuen azalpenak ematen ahaleginduko naiz, izan ere, hauek guztiak itzulpengintzaren alorrarekin loturik daude.

  • Machine translation (MT) edo makina bidezko itzulpengintza: Hizkuntza batetik besterako testuen itzulpenak egiteko makinak bidezko itzulpengintzari deritzo, hau da, makinak erabiliz egindako itzulpenak egitea. Lengoaia natural batetik besterako itzulpen fase horretan software bereziak erabiltzen dira itzulpenak egiteko eta, ondoren, Christian Boitetek dioenez, gizakiek, testuak gainberatu egiten dituzte anbiguotasuna saihesteko.
  • Machine aided translation edo makinaz lagunduriko itzulpengintza: Kasu honetan, gizakiak berak egiten du itzulpen lan osoa baina, ekintza horretarako, makina du lantresna.
  • Multilingual content management edo Elenitzeko edukien kudeaketa: Informazio eta teknologien munduan murgildurik gaudenez, ezinbestekoa suertatzen da informazioa hainbat hizkuntzatan itzulita eduki eta denontzako eskuragai izatea. Horregatik, egun, webgune asko sortzen dira bertsio eleanitzetan. Ondorioz, iturri batetik informazio eskeraga atera dezakegu kudeatzaile batzuei esker.
  • Translation technology edo itzulpen teknologia: Lengoaia natural batetik besterako itzulepenak egitean datza. Gaur egungo itzulpengintzako erronkarik handiena soinu-hotsezko hizkuntza batetik besterako itzulpen simultaneoak egitea da. Lan honetarako, software oso garatuak behar dira, hots, errekonozimenduak egin eta hizkuntza ezberdinetan interpretazioak egiteko.

 

ITURRIAK:

· Itzulpengintza automatikoa. Wikipedia. Orrialdea: http://eu.wikipedia.org/wiki/Itzulpengintza_automatikoa  Kontsulta data: 2009ko maiatzaren 21ean, 14.30etan.

· Machine Translation. Wikipedia. Orrialdea: http://en.wikipedia.org/w/index.php?title=Machine_translation&oldid=203927830    kontsulta data: 2009ko maiatzaren 21ean 14:33etan.

· Machine aided translation. Wikipedia. Orrialdea: http://en.wikipedia.org/wiki/Machine_aided_translation  kontsulta data: 2009ko maiatzaren 20an 22:17etan.

· Kitsite, Multilingual Content Management (2007). Orrialdea: http://www.kitsite.com/articles/multilingual-content-management.html kontsulta data: 2009ko maiatzaren 20an 22:27etan.

· Christian Boitet, 8.4 Machine aided Human Translation. Orrialdea: http://cslu.cse.ogi.edu/HLTsurvey/ch8node6.html Kontsulta data: 2009ko maiatzaren 20an 22:40etan.

Read Full Post »

Older Posts »