PDF lezen vanuit PHP mogenlijk?
ik heb een vraagje, is het mogenlijk om een bestaandde pdf file met behulp van een pdf scripje te lezen? zodat ik de tekst uit de pdf in een variabele heb? En zo ja, hoe doe ik dat...
groet,
arie
rest mij alleen nog te vragen waar je dat voor nodig hebt?
Tot een paar weken geleden stonden de inkoopprijzen gewoon in html op zn website. En toen kon ik heel simpel de prijzen uit de html strippen, en zodoende 1 keer per maand op een redelijk eenvoudige wijze ff van een 1200 artikelen kijken of de prijs nog kloppte, en of het artiekel ubberhaupt nog wel leverbaar was.
Maar nu met die PDF word ik daar dus niet vrolijk van....
Gewijzigd op 04/02/2006 19:37:00 door arie
Heb je al eens naar de PDF extensies op PHP.net gekeken?
Kunnen de leveranciers geen bestanden in xml- (met soap ?) of csv-formaat aanleveren? Vele malen eenvoudiger en waarschijnlijk beschikt men al over 1 van beide formaten. Vraag er eens naar.
Sebastiaan:
Ja heb ik al naar gekeken, daar kan je een PDF mee maken, maar kan je daar ook een PDF mee lezen?Heb je al eens naar de PDF extensies op PHP.net gekeken?
PDF bestand is niets meer dan een print van een bestand...
Frank:
Ik zal er volgende week eens naar vragenKunnen de leveranciers geen bestanden in xml- (met soap ?) of csv-formaat aanleveren? Vele malen eenvoudiger en waarschijnlijk beschikt men al over 1 van beide formaten. Vraag er eens naar.
Hmmm... Nou dan toch maar eens gaan mailen over xml of csv....
Goedemiddag,
Helaas de prijslijst is niet beschikbaar in XML-formaat.
Met vriendelijke groet,
Had al z'on vaag vermoeden, ik vraag me af of ze ubberhaupt weten wat XML is.
Maar goed, nu verder. Hierboven word gesuggereerd dat een PDF eigenlijk een soort van afbeelding is. Dat is dan misschien wel zo, maar in iedergeval is het zo dat de text en de afbeeldingen apart in 1 bestand zitten, en te scheiden zijn, en dat de text (in de meeste gevallen) gewoon echt text is. Kijk maar naar diverse zoekamchines, die hebben regelmatig PDF files in hun zoekresultaten zitten. Dus blijkbaar weten ze wat erin staat.
Ik zat ook te denken: hoe zal een blinde een PDF kunnen lezen? Dus maar ff gekeken op http://www.blindsupport.be/faqpdf.php Voila...
Maar goed, na wat gegoogle, kwam ik op XPDF uit. Op php.net bij de PDF functie uitleg word hierover in het commentaar ook al over gesproken. Dus: yum install xpdf en xpdf is geinstalleerd. In dit pakketje(4 mb) komt ook het progje pdftotxt mee. En hiermee is het een eitje om de text uit een pdf te vissen. Vervolgens nog wel een scripje maken wat die regels 1 voor 1 leest, en de merken, types en prijs uithaalt, maar dat komt wel goed.
Misschien moet je maar eens een scriptje posten van pdf
D@rk:
Euhm... de orginele site, de webshop is www.witgoedderidder.nl Die staat gehost bij Tiscali. Ik heb een eigen test server, dat is www.witgoedderidder.8s.nl Hier knutsel ik aan mn scripjes. En opdiezelfde server (hij staat bij mij thuis) heb ik nog een adresje hangen, dat is www.witgoedspider.8s.nl En hier achter heb ik(achter wachtwoord) een aantal scripts staan waarmee ik prijzen nakijk en dergelijke. Zo ook dus dat met die PDF. Maar die pagina's komen niet op de Tiscali site.Als je je script nu naar je server zal uploaden zal het waarschijnlijk niet werken omdat het die eigen pdf module gebruikt.
Misschien moet je maar eens een scriptje posten van pdf
Misschien moet je maar eens een scriptje posten van pdf