Приказ основних података о дисертацији

The development of library and lenaguage resources for organizing and finding information on spatial planning ; Развитие библиотечных и языковых ресурсов в целях организации информационного поиска по территориальному планиорованию

dc.contributor.advisorKrstev, Cvetana
dc.creatorMilinković, Milena
dc.date.accessioned2023-03-20T21:04:08Z
dc.date.available2023-03-20T21:04:08Z
dc.date.issued2022-09-27
dc.identifier.urihttps://eteze.bg.ac.rs/application/showtheses?thesesId=9030
dc.identifier.urihttps://fedorabg.bg.ac.rs/fedora/get/o:28284/bdef:Content/download
dc.identifier.urihttps://plus.cobiss.net/cobiss/sr/sr/bib/108451081
dc.identifier.urihttps://nardus.mpn.gov.rs/handle/123456789/21290
dc.description.abstractИмајући у виду да правовремени приступ релевантним информацијама, као и дефинисање и развој адекватне терминологије представља предуслов за нова истраживања и даљи развој сваке научне области, у дисертацији су приказане могућности проналажења информација и екстраховања термина, на узорном корпусу просторног планирања коришћењем низа савремених технологија. У раду је указано на многобројне погодности али и извесна ограничења приликом претраживања информација коришћењем Библиотечких информационих система, Географских информационих система и репозиторијума РАУмПЛАН. У наставку је описан садржај, поступак израде и потврђена репрезентативност формираног узорног корпуса просторног планирања. Обрада текста, која подразумева токенизацију, лематизацију, обележавање врсте речи, као и екстракцију термина извршена је алатом Unitex. Корпус је потом постављен на пратформу NoSketch где је, на основу постављених упита, потврђен значај претходне обраде текстова која омогућава претраживање са знатно већим индикатором одзива и прецизности. Издвајањем текстова просторних планова из узорног корпуса, формиран је поткорпус PPTXM, на ком су вршена преостала истраживања. Коришћењем напредних метода и технологија, алатом SrpNER извршено је обележавање и екстраховање различитих група именованих ентитета. Значајан допринос ове дисертације огледа се и у повезивању именованих ентитета у INCEpTION окружењу са ставкама из базе знања Википодаци. Поменута база знања омогућила је груписање ставки, креирањем SPARQL упита, према задатим критеријумима. Визуелизација излазних скупова представљена је у виду мапа, графова, табела и оквира са фотографијама. У TXM окружењу хијерахијском анализом је указано на структуралне особине корпуса: број текстова, пасуса, реченица и корпусних речи. Коришћењем морфолошких етикета, у оквиру TXM система утврђена је фреквентност појављивања различитих врста речи и знакова интерпункције у читавом корпусу. Будући да систем TXM дозвољава и приказивање специфичних језичких појава, омогућено је и праћење прогресијe, односно кумулативнe фреквенцијe различитих врста речи, како кроз цео корпус, тако и кроз његове саставне делове.sr
dc.description.abstractBearing in mind that timely access to relevant information, as well as defining and developing adequate terminology, is a prerequisite for new research and further development in any scientific field, this dissertation presents the possibilities with regard to retrieving information and extracting terms for the sample corpus of spatial planning using a number of modern technologies. The study points out many benefits, but also certain limitations faced when searching for information using Library Information Systems, Geographic Information Systems and the RAUmPLAN repository. The content, preparation process and confirmed representativeness of the sample corpus formed for spatial planning are described below. Processing the text, which includes tokenization, lemmatization, highlighting types of words, and extracting terms was carried out using the Unitex tool. The corpus was then placed on the NoSketch platform, where, on the basis of set queries, the importance of the previous processing of the text was confirmed, making it possible to search with a significantly higher indicator of response and accuracy. By separating the texts of spatial plans from the sample corpus, the PPTXM sub-corpus was formed, on which the remaining research was conducted. Using advanced methods and technologies, the SrpNER tool highlighted and extracted various groups of named entities. The significant contribution of this dissertation is seen in the way it connects named entities in the INCEpTION environment with items from the Wikidata knowledge base. This knowledge base enabled the grouping of items by creating SPARQL queries, according to the given criteria. The output sets were visualized in the form of maps, graphs, tables and photo frames. Hierarchical analysis in the TXM environment indicated the structural features of the corpus: the number of texts, paragraphs, sentences and corpus words. Using morphological labels, the frequency of occurrence of different types of words and punctuation marks in the entire corpus was determined within the TXM system. Since the TXM system allows the display of specific linguistic phenomena, it was also possible to monitor the progression, i.e., the cumulative frequency of different types of words, both throughout the whole corpus and through its constituent parts.en
dc.formatapplication/pdf
dc.languagesr
dc.publisherУниверзитет у Београду, Филолошки факултетsr
dc.rightsopenAccessen
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.sourceУниверзитет у Београдуsr
dc.subjectпросторно планирањеsr
dc.subjectspatial planningen
dc.subjectinformation systemsen
dc.subjectcorpus linguisticsen
dc.subjectlanguage resourcesen
dc.subjectnatural language processingen
dc.subjectterm extractionen
dc.subjectinformation retrievalen
dc.subjectинформациони системиsr
dc.subjectкорпусна лингвистикаsr
dc.subjectјезички ресурсиsr
dc.subjectобрада природних језикаsr
dc.subjectекстракција терминаsr
dc.subjectпроналажење информацијаsr
dc.titleРазвој библиотечких и језичких ресурса за организовање и проналажење информација о просторном планирањуsr
dc.title.alternativeThe development of library and lenaguage resources for organizing and finding information on spatial planning ; Развитие библиотечных и языковых ресурсов в целях организации информационного поиска по территориальному планиорованиюen
dc.typedoctoralThesis
dc.rights.licenseBY-NC-ND
dc.identifier.fulltexthttp://nardus.mpn.gov.rs/bitstream/id/150119/Disertacija_13359.pdf
dc.identifier.fulltexthttp://nardus.mpn.gov.rs/bitstream/id/152706/Referat.pdf
dc.identifier.rcubhttps://hdl.handle.net/21.15107/rcub_nardus_21290


Документи за докторску дисертацију

Thumbnail
Thumbnail

Ова дисертација се појављује у следећим колекцијама

Приказ основних података о дисертацији