Scanderen
Een simpele vraag: is het mogelijk om via PHP een zin te scanderen? Eventueel ook benoeming van woordsoorten. Ik heb zitten denken hoe dit mogelijk is, maar volgens mij kan dit alleen met een database vol met woorden, of niet soms?
Even voor de eerste die komt met 'google het eens':
In het engels is scanderen to scan, raad eens wat voor resultaten ik dan krijg.
Gewijzigd op 01/01/1970 01:00:00 door Steen
Dit is vrijwel onmogelijk, tenzij je hem zelf lerend maakt, en er voor zorgt dat niemand foute input maakt.
Maar dan kom je bij een extreem moeilijk stuk AI, wat zeker voor 90% van de programmeurs niet te doen is.
Maar als je een opzetje wil,
Zet de Nederlandse grammatica eens volop in kaart.
En dan bedoel ik alle regels, maar dan gerelativeerd.
Als je dit hebt, en je hebt een database van alle woorden, dan bestaat er een mogelijkheid dat je misschien in 20% van alle gevallen een goed antwoord terug kan geven.
Als hij zelf lerend is, en hij word daarna goed geupdate, dan zou je dit mogelijk tot 100% kunnen krijgen, en dat misschien als binnen 8 jaar :)
Ik wil je niet uit je droom helpen,
Het kan zeker,
Maar het is wel heel erg hoog gegrepen.
Lopen:
gelopend
lopend
liep
lopende
gelopen
loopt
liepen
Je hebt alleen al van de werkwoorden zo veel vormen.
En dan krijg je nog bijvoeglijk gebruikt, onvoltooid tegenwoordige tijd etc etc etc.
En 't kofschip etc etc etc.
En dan ook nog eens voor nieuwe woorden... want de regels zouden ook op onzinwoorden moeten werken, als: flipsen, gronniken, groven etc.
Ik vroeg me af, omdat het voor mensen al een probleem is (denk maar aan lettergrepen, klemtoon) te bepalen, dat een computer dit automatisch beter zou kunnen.
Alles wat met taal te maken heeft is in programmeertaal volgens mij lastig te analyseren.
Wel vreemd dat er niet iets voor bestaat, er moet toch wel iemand zijn die zoiets heeft geprobeerd (ookal is het in het engels)? Interessante links zijn altijd welkom.
Natural Language Processing. Ow, en een bepaalde firefox plugin ;)
edit: wat jij bedoelt is waarschijnlijk shallow parsing. Dat is zeg maar alleen de vorm van een woord bepalen, en niet de functie (de betekenis). Dat is wel al redelijk mogelijk volgens mij, maar simpel zal het niet zijn.
Het is een hele wetenschap. Een deel van AI en een deel van Linguistics houden zich er mee bezig: edit: wat jij bedoelt is waarschijnlijk shallow parsing. Dat is zeg maar alleen de vorm van een woord bepalen, en niet de functie (de betekenis). Dat is wel al redelijk mogelijk volgens mij, maar simpel zal het niet zijn.
Gewijzigd op 01/01/1970 01:00:00 door Jelmer -
Voor het engels is het al makkelijker als voor het Nederlands, want de Engelse grammatica slaat wel ergens op, in tegenstelling tot de Nederlandse grammatica.
Wij hebben op iedere regel wel een uitzondering, en zelfs die uitzonderingen hebben nog een uitzonderingen.
Voor de rest vind ik het een beetje jammer dat je mijn vraag meteen als vooroordeel beschouwt, zegt trouwens wel heel erg veel over jou.
Maar als het geen vraag was geweest, dan was het een suggestie, en geen vooroordeel.
Ik denk dat Nederlands inderdaad lastig is omdat je ten eerste al dat leuke verschil in woordvolgorde tussen hoofd- en bijzinnen hebt, en daarnaast nog een enorm leger aan leenwoorden die allemaal de regeltjes van hun eigen taal volgen :/
Eddy Erkelens schreef op 24.06.2009 18:49:
Lopen:
gelopend
lopend
liep
lopende
gelopen
loopt
liepen
gelopend
lopend
liep
lopende
gelopen
loopt
liepen
Ik mis loop nog. En wat is gelopend?
Makkerlijker dan in dit geval. Dat zijn toch dingen die een computer makkelijk moet kunnen onderscheiden. Wanneer je het groene boekje er bij pakt en alle grammatica verwerkt een lijst woorden toevoegt is volgens mij al redelijk wat mogelijk. Maar dan kom je weer uit op het geval met die google-vertalingen: meerdere woordbetekenissen etc.
Werkwoorden zijn trouwens niet zo'n groot probleem, er bestaan genoeg lijsten van, daar pas je de vervoegregels op toe en je bent klaar. Wanneer je een sterk werkwoord (als ik het goed heb) neemt wordt het al lastiger.
Interessant, dit zijn van die dingen die verder gaan dan een forum of een gastenboek. Zijn hier in ook speciale studies voor? Bestaan er boeken over?
raam & ramen zijn altijd zelfstandig naamwoorden.
Op deze manier kom je al een heel end :)
Paul schreef op 24.06.2009 20:19:
raam & ramen zijn altijd zelfstandig naamwoorden.
Helaas, ramen is ook een werkwoord.
Edit:
raam het; o ramen; -pje 1 lijst (2) 2 venster, het glas (met het kozijn) 3 houtwerk enz. waarin of waarop iets gespannen wordt
ra·men raamde, h geraamd begroten, schatten
Gewijzigd op 01/01/1970 01:00:00 door - SanThe -
steen schreef op 24.06.2009 19:41:
keep on dreaming engels is ook moeilijk je zou kunnen zeggen alles wat op ing eindigt is present- past continuous. En dan kom je dit tegen Soaking wet(klets nat) is dit een present- past continuous??
Er bestaat ook studies over SEO, maar dan over hoe je zoekmachines sneller en beter kan maken.
Maar dit zijn eigenlijk meer studies voor na je studie.
Dus dan kan je het beste beginnen met een studie informatica / software engineering.
Dan een studie *taal naar keuze* en dan zelf een studie maken naar hoe je hier software voor schrijft.
En ik denk dat je nog maar even goed de definitie van een vooroordeel moet kijken.
Ik stel een suggestieve vraag, een vooroordeel bestaat niet eens in vraag vorm.
@degeen hierboven
Soacking is dat weer een bijvoegelijk naamwoord.
Je kan volgens mij in het engels ook niet zeggen, alles wat op ING eindigt is deze regel.
Volgens mij zijn daar andere regels voor.
Zo kunnen wij ook niet zeggen dat alles wat op dde eindigt verleden tijd is.
Gewijzigd op 01/01/1970 01:00:00 door Nicoow Unknown
SanThe schreef op 24.06.2009 19:22:
Ik mis loop nog. En wat is gelopend?
Eddy Erkelens schreef op 24.06.2009 18:49:
Lopen:
gelopend
lopend
liep
lopende
gelopen
loopt
liepen
gelopend
lopend
liep
lopende
gelopen
loopt
liepen
Ik mis loop nog. En wat is gelopend?
Die laatste d is een typefout ;).
En loop mag er ook nog bij natuurlijk ;).
beginnend met tt, dan vt, en dan die andere tijden
je had daar z'n mooi tabelletje voor, maar k ben te lui om te ASCII art-en
ik loop
hij/zij loopt
wij lopen
ik liep
hij liep
wij liepen
gelopen (volt. dw)
lopende (bijv. nw)
lopend (onwelvoegelijkvoornaamzetsel, (vraag maar aan hans))