|
|||||||||||||||||||||||||||
Morten Bo Johansen wrote: > Jeg har lavet en fil hvor alle ord (en forekomst af hver og ca. 100.000 > ord ialt) i DBL er anført på en linje for sig. Hvis jeg kan få fat i en En användbar metod är: cat *.txt | aspell -l | sort | uniq -c | sort -nr | less Aspell filtrerar bort de ord som redan finns i ordlistan och skriver ut övriga ord (de okända) på varsin rad. Sekvensen sort-uniq-sort ser till att orden listas i fallande frekvensordning. Sedan kan man föra in orden i ny-danska ordlistan eller gammal-danska ordlistan från toppen av listan. *Jag* kan inte göra detta, eftersom jag inte kan bedöma vad som är ny-danska och vad som är gammaldanska. När man arbetat ett tag, kan man bygga om ordlistan för aspell och köra cat *.txt | aspell -l | wc -l för att se hur långt man har kommit. wc räknar antal rader = ord som återstår (inklusive dubletter). Den här metoden använder inte aspell interaktivt, utan bara som filter. Den använder inte heller speling.org's web-interaktion. -- Lars Aronsson (sslug@sslug) Aronsson Datateknik - http://aronsson.se/
|
||||||||||||||
|
||||||||||||||