Classificeren met vertrouwen : contextgevoelige tekstclassificatie met betrouwbaarheidsindicatie

Author(s): Schrijver, Bert Jan (2006)

Abstract:
Dit verslag beschrijft een onderzoek naar methoden voor automatische tekstclassificatie. Het doel van tekstclassificatie is het indelen van teksten of documenten in een vooraf bepaalde verzameling van categorieën. Zo kunnen bijvoorbeeld krantenartikelen worden ingedeeld in categorieën als binnenland, buitenland, economie, sport en wetenschap.Dit onderzoek is gericht op het ontwikkelen van een classificatiemethode waarbij rekening wordt gehouden met contextinformatie. Naast deze methode wordt een confidence level geïntroduceerd: een betrouwbaarheidsindicatie voor de juistheid van een classificatieresultaat. Ook wordt de toepasbaarheid van een classificatiesysteem onderzocht op documentclustering: het automatisch aanbrengen van een categoriestructuur in een verzameling ongelabelde documenten.

Document(s):

Scriptie_Schrijver.pdf