University of Twente Student Theses
Classificeren met vertrouwen : contextgevoelige tekstclassificatie met betrouwbaarheidsindicatie
Schrijver, Bert Jan (2006) Classificeren met vertrouwen : contextgevoelige tekstclassificatie met betrouwbaarheidsindicatie.
PDF
2MB |
Abstract: | Dit verslag beschrijft een onderzoek naar methoden voor automatische tekstclassificatie. Het doel van tekstclassificatie is het indelen van teksten of documenten in een vooraf bepaalde verzameling van categorieën. Zo kunnen bijvoorbeeld krantenartikelen worden ingedeeld in categorieën als binnenland, buitenland, economie, sport en wetenschap.Dit onderzoek is gericht op het ontwikkelen van een classificatiemethode waarbij rekening wordt gehouden met contextinformatie. Naast deze methode wordt een confidence level geïntroduceerd: een betrouwbaarheidsindicatie voor de juistheid van een classificatieresultaat. Ook wordt de toepasbaarheid van een classificatiesysteem onderzocht op documentclustering: het automatisch aanbrengen van een categoriestructuur in een verzameling ongelabelde documenten. |
Item Type: | Essay (Master) |
Clients: | Carp technologies |
Faculty: | EEMCS: Electrical Engineering, Mathematics and Computer Science |
Subject: | 54 computer science |
Programme: | Interaction Technology MSc (60030) |
Link to this item: | https://purl.utwente.nl/essays/56934 |
Export this item as: | BibTeX EndNote HTML Citation Reference Manager |
Repository Staff Only: item control page