Digitális Bölcsészet
Latest Publications


TOTAL DOCUMENTS

42
(FIVE YEARS 23)

H-INDEX

1
(FIVE YEARS 0)

Published By Digitalis Bolcseszet

2630-9696

Author(s):  
Albert Leśniak ◽  
Zbigniew Pasek

Jelen tanulmány tárgya evangelizáló tanúságtételek komparatív elemzése római katolikus (a Deon.pl internetes portál) és protestáns – pünkösdi-karizmatikus (a Chrześcijanin folyóirat stb.) források alapján. A szerzők a korpusznyelvészet eszközeinek felhasználásával rávilágítanak a két korpusz közötti eltérésekre. Érdekesnek bizonyult a „bűn területeinek” rekonstruálása – a rossznak, amit az Isten segítségével a tanúságot tevő emberek legyőztek. Ez két eltérő terület: a katolikus tanúságtételek esetén a szerelem–szex–aszkézis fogalmak köré épül a szemantikai mező. A pünkösdi tanúságtételek az élvezeti cikkek–függőség–patológia fogalmak köré összpontosulnak. A két részből álló kutatás (a korpuszon végzett gyakoriság- és a kulcsszóelemzés, valamint a leglényegesebb kollokációk vizuális bemutatása) eredményeképpen következtetések vonhatók le azokról a domináns jelentéstartományokról, amik meghatározzák a keresztényegyház e két ágához tartozó hívek vallásos életének mentális térképét.


Author(s):  
Jan Rybicki

A kutatás első fázisa a szógyakoriságok többváltozós elemzését a szerzők nemének azonosítására használta egy 18. századi és 19. század eleji szentimentális és gótikus regényeket tartalmazó korpuszban. Ennek érdekében kerültek összehasonlításra a különböző nemekre vonatkozó leggyakoribb és a Burrows Zetamódszerével létrehozott közepes gyakoriságú szavak listája. A kutatás második fázisában a már két korszakból származó (18–19. és 19–20. század) kifejezések összehasonlító elemzése szintén arra kereste a választ, hogy mennyire használhatók ezek a szerzők nemének meghatározásakor.


Author(s):  
Artjoms Šeļa ◽  
Boris Orekhov ◽  
Roman Leibov
Keyword(s):  

A dolgozat egy már meglévő, „a versmérték jelentésmezőjeként” ismert költészetelmélet formalizálását kísérli meg, amely elmélet azt állítja, hogy a modern líra különböző metrikai formái bizonyos jelentésbeli asszociációkat halmoznak fel és őriznek meg. Az LDA témamodellező (topic modelling) algoritmussal vizsgáltuk az orosz költészet tág korpuszát (1750–1950), hogy ezáltal minden egyes verset egy tématérben, a versmértékeket pedig a témák valószínűségének eloszlása szerint reprezentáljunk. Nem felügyelt osztályozást és kiterjedt mintavételt alkalmazva megmutatjuk, hogy a verselési formákon belül és között erős a forma és a jelentés kapcsolata: ugyanahhoz a versmértékhez tartozó két minta sokszor nagyon is hasonlóként tűnik fel, és ugyanannak a családnak két verselési formája legtöbbször szintén egy klaszterbe kerül. Ez a kapcsolat akkor is kimutatható, ha a korpusz kronológiai szempontból ellenőrzött, és nem következménye a populáció méretének. Amellett érvelünk, hogy hasonló megközelítést nyelvek és költészetihagyományok szemantikai mezőinek összehasonlításakor is alkalmazni lehet, amelynek révén az irodalomtörténet legalapvetőbb kérdéseire adhatók releváns válaszok.


Author(s):  
Greta Franzini ◽  
Mike Kestemont ◽  
Gabriela Rotari ◽  
Melina Jander ◽  
Jeremi K. Ochab ◽  
...  

Az alábbi cikk egy multidiszciplináris projekt eredményeit mutatja be, amely a különböző digitalizációs stratégiák számítógépes szöveganalízisben való használhatóságát járja körül. Pontosabban Jacob és Wilhelm Grimm szerzőségének automatizált megkülönböztetésére tettünk kísérletet, melyet egy HTR (HandwrittenText Recognition – kézzel írott szöveg felismerése) és OCR (Optical Character Recognition – optikai karakterfelismerés) által feldolgozott levelezéskorpuszban hajtottunk végre, korrekció nélkül – felmérve, hogy az így keletkezett zaj milyen hatással van a fivérek különböző írásmódjának azonosítására. Összegezve,úgy tűnik, hogy az OCR megbízható helyettesítője lehet a manuális átírásnak, legalábbis a szerzőazonosítás kérdéskörét illetően. Eredményeink továbbá abba az irányba mutatnak, miszerint még a különböző digitalizációs eljárásokból származó tanító- és tesztkorpuszok (training and test set) is használhatók a szerzőazonosítás során. A HTR-t tekintve a kutatás azt demonstrálja, hogy ez az automatizált átírás ugyan az OCR-hez képest szignifikánsan növeli a szövegek félrecsoportosításának veszélyét, ám körülbelül 20% feletti tisztaság már önmagában elegendő ahhoz, hogy a véletlennél nagyobb esélye legyen a helyes binárismegfeleltetésnek.


Author(s):  
Maciej Eder
Keyword(s):  

A jelen tanulmány az Elena Ferrante írói álnév alatt publikált regényeket vizsgálja azért, hogy kísérletet tegyen az álnév mögött rejtőző szerzőség azonosítására. A tanulmány ugyanakkor többre vállalkozik annál, minthogy egyszerűen újranyissa a szerzőazonosítás kérdését; a kutatás valódi jelentősége az, hogymagának a szerzői ujjlenyomatnak az állandóságát teszteli Ferrante műveinek vonatkozásában, rejtőzzön akárki is az írói álnév mögött. A kutatási kérdés megválaszolásához egy 150 regényből álló korpusz állt rendelkezésre, a stilisztikai hasonlóság méréséhez az úgynevezett Bootstrap Consensus Network eljárásthasználta a kutatás. Azon szerzők listája, akiknek a szerzői ujjlenyomata a leginkább egyezőnek bizonyult „Ferrante” lenyomataival – köztük Domenico Starnonéval a lista élén – az úgynevezett Rolling Classify (’mozgó osztályozás’) metódus alkalmazásával vált hozzáférhetővé. Ez a módszer – amit Ferrante ésStarnone regényein egymástól függetlenül alkalmaztunk – az irodalmi szövegek lokális stilisztikai sajátosságainak feltárására alkalmas, ami ezáltal részletesebb megfigyeléseket is megfogalmazhatóvá tesz. Az összkép, néhány kivételtől eltekintve, megerősíti, hogy Starnone és Ferrante stílusa megkülönböztethető egymástól, ami viszont erős érvnek mutatkozik a „virtuális szerzőség” hipotézise mellett. Úgy tűnik, hogy Domenico Starnone – különösen kései műveiben – képes megkülönböztetni egymástól saját és alteregója hangját.


Author(s):  
Helena Grochola-Szczepanek ◽  
Ruprecht von Waldenfels ◽  
Rafał L. Górski ◽  
Michał Woźniak

A tanulmány a lengyel Szepesség nyelvjárásának korpuszát létrehozó projektet ismerteti. A lengyelországi dialektológiai kutatások többségétől eltérően korpuszunk a fiatal és a középgeneráció beszédét is tartalmazza, mivel célja a régió nyelvjárásának, szociolingvisztikai helyzetének dokumentálása is. A felvételeket nem fonetikusan, hanem a sztenderd lengyel ortográfiával írtuk át, ami nemcsak a korpuszban való egyszerű keresést teszi lehetővé, hanem azt is, hogy a meglévő eszközökkel lemmatizáljuk és morfoszintaktikai annotációval egészítsük ki a szövegeket. A fonetika iránt érdeklődő felhasználók a felvételeket mondatonként érhetik el. A cikk ismerteti a korpusz összeállításának lépéseit, és tárgyalja a lehetséges alkalmazásokat. A szerzők amellett kívánnak érvelni, hogy egy nagy korpusz, amely egy kis, homogén területet fed le, sokkal értékesebb forrás a dialektológusok számára, mint egy sor kisebb korpusz, amely egy nagyobb régiót dokumentál.


2021 ◽  
Vol 4 ◽  
Author(s):  
Botond Szemes

A tanulmány egy olyan módszer kidolgozására tesz kísérletet, amely lehetővé teszi a magyar írott nyelvben a tagmondatkapcsolatok különböző típusainak automatikus azonosítását a kötőszavak és a relatív névmások mondatban elfoglalt helyzetének elemzésén keresztül. Ez a módszer új távlatokat nyithat meg a stilometriai kutatások számára: a kötőszavak és a névmások egyfelől mint funkciószavak statisztikailag megfelelő mennyiségű adatot szolgáltatnak a szövegek mélystruktúráinak feltérképezéséhez, másfelől tartalmas – grammatikai – jelentést is hordoznak (a tagmondatok között létesülő kapcsolatokról), ezáltal az eloszlásukra vonatkozó eredmények könnyen értelmezhetők. Az egyes típusok relatív gyakoriságának vizsgálatával ugyanis lehetővé válik, hogy meghatározzuk az egy szövegre vagy szövegcsoportra legjellemzőbb/legkevésbé jellemző kapcsolattípusokat. Ennek köszönhetően a regények stílusa és poétikája a mondat szintjén válik megragadhatóvá, miközben a szövegeknek olyan topológiailogikai karaktere is feltárulhat, amely az olvasás során általában reflektálatlan marad. A tanulmány 100 magyar regény vizsgálatán keresztül tesz kísérletet az egyes szövegek mondatstilisztikai elemzésére, valamint stílustörténeti tendenciák és poétikai hagyományok azonosítására a magyar regényirodalomban.


2021 ◽  
Vol 4 ◽  
Author(s):  
Ted Underwood ◽  
Csaba Maczelka

A kutatók még a „műfaj” jellegét illetően sem értenek egyet. Kérdéses például, hogy szöveges mivoltuk vagy társadalmi recepciójuk határozza meg inkább a műfajokat? Állandó kategóriáknak, évszázadokon átívelő történelmi konstrukcióknak vagy éppen rövid távú generációs jelenségeknek számítanak? A tanulmány e véget nem érő vitákhoz kapcsolódik újszerű kvantitatív módszerekkel. Kimutatja, hogy a műfajok társadalmi és szövegalapú definíciói jól összehangolhatók: az olvasó ítélete alapján meghatározott műfajok a szöveg bizonyos jegyei alapján is felismerhetők. Erre az eredményre építve a tanulmány a műfajok szokásos élettartamával kapcsolatos ellentmondásokat vizsgálja. Kiderül, hogy a különféle műfaji modellek gyakran még akkor is összeegyeztethetők egymással, ha definíciójuk különböző korok olvasói ítélete alapján született. Így például azok a modellek, amelyek felismerik a tizenkilencedik századi „detektívtörténeteket” és „tudományos románcokat”, a huszadik századi „krimit” és „sci-fit” is felismerik. A bizonyítékok tehát arra utalnak, hogy – bár a műfajok bizonytalan történelmi konstrukciók – egy részük jóval maradandóbb, mint ahogy azt az irodalomtörténészek feltételezik. Ám ez nem minden esetben igaz. A gótikus irodalom például éppen olyan laza és változékony, mint amilyennek a kritikusok eddig is tekintették.


Sign in / Sign up

Export Citation Format

Share Document