Exjobbsförslag från företag

Detta är ett uppsatsförslag hämtat från Nationella Exjobb-poolen. Klicka här för att komma tillbaka till samtliga exjobbsförslag.

Förslaget inkom 2005-04-22

Klassificering av HTML dokument

OBS! ANSÖKNINGSTIDEN FÖR DETTA EXJOBB HAR LÖPT UT.
Examensarbetet syftar till att utveckla en klassificeringsapplikation för stora mänger HTML-dokument. Den tilltänkta tekniken är maskininlärningsmetoder, liknade de som används i olika spamfilter. Syftet med applikationen är att slutprodukten skall kunna identifiera och filtrera bort oönskade sidor innehållande icke familjevänligt material.

Arbetet ska ta stor hänsyn till tidigare forskning samt undersöka/tillämpa liknande och närliggande lösningar som t.ex. SpamAssasin, CRM114 och dSPAM. En kravspecifikation för verifikation och validering skall tas fram. Verifikation av vald lösning samt implementation av applikation ska utföras i Linux miljö i programmeringsspråken C/C++ och/eller perl.


  GÅ TILL XJOBB.NU FÖR FULLSTÄNDIG INFO OM DETTA EXJOBB
Informationen om uppsatsförslag är hämtad från Nationella Exjobb-poolen.