University of Twente Student Theses

Login

Classificeren met vertrouwen : contextgevoelige tekstclassificatie met betrouwbaarheidsindicatie

Schrijver, Bert Jan (2006) Classificeren met vertrouwen : contextgevoelige tekstclassificatie met betrouwbaarheidsindicatie.

[img]
Preview
PDF
2MB
Abstract:Dit verslag beschrijft een onderzoek naar methoden voor automatische tekstclassificatie. Het doel van tekstclassificatie is het indelen van teksten of documenten in een vooraf bepaalde verzameling van categorieën. Zo kunnen bijvoorbeeld krantenartikelen worden ingedeeld in categorieën als binnenland, buitenland, economie, sport en wetenschap.Dit onderzoek is gericht op het ontwikkelen van een classificatiemethode waarbij rekening wordt gehouden met contextinformatie. Naast deze methode wordt een confidence level geïntroduceerd: een betrouwbaarheidsindicatie voor de juistheid van een classificatieresultaat. Ook wordt de toepasbaarheid van een classificatiesysteem onderzocht op documentclustering: het automatisch aanbrengen van een categoriestructuur in een verzameling ongelabelde documenten.
Item Type:Essay (Master)
Clients:
Carp technologies
Faculty:EEMCS: Electrical Engineering, Mathematics and Computer Science
Subject:54 computer science
Programme:Human Media Interaction MSc (60030)
Link to this item:http://purl.utwente.nl/essays/56934
Export this item as:BibTeX
EndNote
HTML Citation
Reference Manager

 

Repository Staff Only: item control page