|
|||||||||||||||||||||||||||
Søndag den 8. juni 2003 18:55 skrev du: > Hej > > I et anfald af hedeslag, fik jeg den tanke at man kunne bruge Google > som ordbog. > > * for alle hjemmesider hvor sproget ligner dansk > * for et domæne notér alle ord een gang > * notér hvor mange gange et ord forekommer > > Nu var tanken så at de første 100.000 ord der optræder flest gange, > sandsynligvis er stavet rigtigt. > > Måske skulle man for hvert domæne kun tage de ord som optræder 50% > flest gang, for på den måde eliminere ord der kan være stavet forkert. > > Det bliver ikke en komplet ordbog, men kunne det ikke blive noget der > hendad der kan bruges? Min erfaring med dsdo siger mig at problemet ikke er at skaffe ord (og slet ikke de normale). Dsdo har 300000 ord, og det er alt rigeligt. Problemet er snarere at få alle former af ordene med. Der er virkelig mange ord der mangler de lidt mere usædvanlige former såsom lang tillægsform o.lign. Det virker ikke særlig gennemført hvis ordbogen kender guddommeligt men ikke guddommelige eller omvendt. Jeg har sagt det før, og må indrømme at jeg ikke selv har bidraget særligt konstruktivt andet end at gøre opmærksom på problemet, men altså hvis vi kunne få styr på grammatiken ville ordbogen gå fra at være delvis brugbar til suveræn. Sommerhilsen Sune > > mvh/hans
|
||||||||||||||
|
||||||||||||||