PDF lezen vanuit PHP mogenlijk?

Overzicht Reageren

Sponsored by: Vacatures door Monsterboard

Arie

arie

04/02/2006 19:14:00
Quote Anchor link
Hoi,

ik heb een vraagje, is het mogenlijk om een bestaandde pdf file met behulp van een pdf scripje te lezen? zodat ik de tekst uit de pdf in een variabele heb? En zo ja, hoe doe ik dat...

groet,
arie
 
PHP hulp

PHP hulp

22/12/2024 19:58:15
 
Bart van der veen

bart van der veen

04/02/2006 19:28:00
Quote Anchor link
pdf = Portable Document Format. dit betekend dat je een programma nodig hebt om het te kunnen lezen. het werkt als volgt: (vanuit een grafische standpunt) de bits en bits van het bestand vormen geen woorden uit letters maar uit vormen. het is dus meer een plaatje als echt tekst. het is technische iets gecompliceerder maar de strekking klopt. het is volgens mij net zo min mogelijk als tekst halen uit een swf. (flash)

rest mij alleen nog te vragen waar je dat voor nodig hebt?
 
Arie

arie

04/02/2006 19:36:00
Quote Anchor link
Ik heb een webshop in ouderhoud, en 1 van de leveranciers is creatief bezig geweest met PDF. Met andere woorden: de inkoopprijzen worden aangeleverd in een keurig netjes PDF bestandje. Ziet er leuk uit, maar ik heb er zo dus in mn scripje niet veel aan.

Tot een paar weken geleden stonden de inkoopprijzen gewoon in html op zn website. En toen kon ik heel simpel de prijzen uit de html strippen, en zodoende 1 keer per maand op een redelijk eenvoudige wijze ff van een 1200 artikelen kijken of de prijs nog kloppte, en of het artiekel ubberhaupt nog wel leverbaar was.

Maar nu met die PDF word ik daar dus niet vrolijk van....
Gewijzigd op 04/02/2006 19:37:00 door arie
 

04/02/2006 19:46:00
Quote Anchor link
Heb je al eens naar de PDF extensies op PHP.net gekeken?
 
Frank -

Frank -

04/02/2006 19:48:00
Quote Anchor link
Kunnen de leveranciers geen bestanden in xml- (met soap ?) of csv-formaat aanleveren? Vele malen eenvoudiger en waarschijnlijk beschikt men al over 1 van beide formaten. Vraag er eens naar.
 
Arie

arie

04/02/2006 20:04:00
Quote Anchor link
Sebastiaan:
Heb je al eens naar de PDF extensies op PHP.net gekeken?
Ja heb ik al naar gekeken, daar kan je een PDF mee maken, maar kan je daar ook een PDF mee lezen?
 
Eris -

Eris -

04/02/2006 20:05:00
Quote Anchor link
Nope

PDF bestand is niets meer dan een print van een bestand...
 
Arie

arie

04/02/2006 20:05:00
Quote Anchor link
Frank:
Kunnen de leveranciers geen bestanden in xml- (met soap ?) of csv-formaat aanleveren? Vele malen eenvoudiger en waarschijnlijk beschikt men al over 1 van beide formaten. Vraag er eens naar.
Ik zal er volgende week eens naar vragen
 
Arie

arie

04/02/2006 20:26:00
Quote Anchor link
Hmmm... Nou dan toch maar eens gaan mailen over xml of csv....
 
Arie

arie

14/02/2006 18:32:00
Quote Anchor link
Eeey ik kom nog ff melden hoe het met die pdf zit. Ik heb dus ff gemaild, maar het antwoord was simpel:

Goedemiddag,

Helaas de prijslijst is niet beschikbaar in XML-formaat.

Met vriendelijke groet,

Had al z'on vaag vermoeden, ik vraag me af of ze ubberhaupt weten wat XML is.


Maar goed, nu verder. Hierboven word gesuggereerd dat een PDF eigenlijk een soort van afbeelding is. Dat is dan misschien wel zo, maar in iedergeval is het zo dat de text en de afbeeldingen apart in 1 bestand zitten, en te scheiden zijn, en dat de text (in de meeste gevallen) gewoon echt text is. Kijk maar naar diverse zoekamchines, die hebben regelmatig PDF files in hun zoekresultaten zitten. Dus blijkbaar weten ze wat erin staat.

Ik zat ook te denken: hoe zal een blinde een PDF kunnen lezen? Dus maar ff gekeken op http://www.blindsupport.be/faqpdf.php Voila...

Maar goed, na wat gegoogle, kwam ik op XPDF uit. Op php.net bij de PDF functie uitleg word hierover in het commentaar ook al over gesproken. Dus: yum install xpdf en xpdf is geinstalleerd. In dit pakketje(4 mb) komt ook het progje pdftotxt mee. En hiermee is het een eitje om de text uit een pdf te vissen. Vervolgens nog wel een scripje maken wat die regels 1 voor 1 leest, en de merken, types en prijs uithaalt, maar dat komt wel goed.
 
Bram Z

Bram Z

14/02/2006 19:23:00
Quote Anchor link
Als je je script nu naar je server zal uploaden zal het waarschijnlijk niet werken omdat het die eigen pdf module gebruikt.

Misschien moet je maar eens een scriptje posten van pdf
 
Arie

arie

14/02/2006 19:30:00
Quote Anchor link
D@rk:
Als je je script nu naar je server zal uploaden zal het waarschijnlijk niet werken omdat het die eigen pdf module gebruikt.

Misschien moet je maar eens een scriptje posten van pdf
Euhm... de orginele site, de webshop is www.witgoedderidder.nl Die staat gehost bij Tiscali. Ik heb een eigen test server, dat is www.witgoedderidder.8s.nl Hier knutsel ik aan mn scripjes. En opdiezelfde server (hij staat bij mij thuis) heb ik nog een adresje hangen, dat is www.witgoedspider.8s.nl En hier achter heb ik(achter wachtwoord) een aantal scripts staan waarmee ik prijzen nakijk en dergelijke. Zo ook dus dat met die PDF. Maar die pagina's komen niet op de Tiscali site.
 



Overzicht Reageren

 
 

Om de gebruiksvriendelijkheid van onze website en diensten te optimaliseren maken wij gebruik van cookies. Deze cookies gebruiken wij voor functionaliteiten, analytische gegevens en marketing doeleinden. U vindt meer informatie in onze privacy statement.