[PHP] Vraag over simple html dom

Overzicht Reageren

Sponsored by: Vacatures door Monsterboard

PHP er

PHP er

22/02/2020 06:56:49
Quote Anchor link
Hoi allemaal,

Ik probeer via simple html dom de inhoud van een Facebookbericht te scrapen, maar ik kom er niet uit..

Code (php)
PHP script in nieuw venster Selecteer het PHP script
1
2
3
4
5
6
7
8
9
ini_set('user_agent', 'MyBrowser v42.0.4711');    
include 'htmldom/simple_html_dom.php';
                
  
   // DOM opslaan in variabele  

     $html = file_get_html(':https://www.facebook.com/facebookapp/posts/10159137047256729');
     $a = $html->find('div[data-testid=post_message]');
     echo $a->plaintext;


Weet iemand wat ik verkeerd doe?
 
PHP hulp

PHP hulp

25/12/2024 17:15:55
 
- Ariën  -
Beheerder

- Ariën -

22/02/2020 09:17:58
Quote Anchor link
Wat is er eigenlijk mis met de API?
 
PHP er

PHP er

22/02/2020 14:15:17
Quote Anchor link
- Ariën - op 22/02/2020 09:17:58:
Wat is er eigenlijk mis met de API?


Daarmee kun je zonder pagetoken met toegang tot de betreffende pagina, geen recensies scrapen van andere Facebookpagina’s. Alleen van je eigen Facebookpagina.
 
- Ariën  -
Beheerder

- Ariën -

22/02/2020 14:24:45
Quote Anchor link
Maar waar loop je op vast?
Is het die dubbele punt voor de URL?
Gewijzigd op 22/02/2020 14:30:01 door - Ariën -
 
PHP er

PHP er

22/02/2020 15:18:43
Quote Anchor link
- Ariën - op 22/02/2020 14:24:45:
Maar waar loop je op vast?
Is het die dubbele punt voor de URL?

Jeetje, scherp haha! De dubbele punt is weggehaald, maar krijg eigenlijk nog geen output te zien met deze code :O

Weet jij misschien waarom er geen output te zien is? In de broncode van die pagina, móet die DIV wel bestaan uit de inhoud van het bericht
 
Thomas van den Heuvel

Thomas van den Heuvel

22/02/2020 15:32:24
Quote Anchor link
Maar al die HTML staat in een <!-- commentaarblok -->. Mogelijk wordt dat dan anders behandeld in/maakt het geen onderdeel uit van de DOM? Of misschien moet je een flag aanzetten zodat ie commentaar ook pakt?

Probeer anders het omvattende code-blok eens op te vragen (<code id="u_0_1m">...</code>) en kijk wat ie daarvan retourneert?
 
- Ariën  -
Beheerder

- Ariën -

23/02/2020 01:30:33
Quote Anchor link
Kan je iets vinden in een simpele var_dump?
 
PHP er

PHP er

23/02/2020 21:43:52
Quote Anchor link
- Ariën - op 23/02/2020 01:30:33:
Kan je iets vinden in een simpele var_dump?

dan krijg ik helaas een lege output.. :-(
 
- Ariën  -
Beheerder

- Ariën -

23/02/2020 21:46:17
Quote Anchor link
En een stapje terug, op $html?
 
Michael -

Michael -

24/02/2020 17:29:21
Quote Anchor link
Ze blokkeren dit bewust. Dit is het resultaat als je gewoon de pagina ophaalt
Afbeelding

Het bericht wordt pas later ingeladen en zelfs met xpath comment() blijft deze leeg.

Edit Ah plaatjes werken niet meer.... KLIK
Gewijzigd op 24/02/2020 17:29:51 door Michael -
 
- Ariën  -
Beheerder

- Ariën -

25/02/2020 22:12:49
Quote Anchor link
Gaat via een AJAX-request dus. Of ze dit bewust als blokkade doen weet ik niet. Maar ik denk dat het toch API werk zal worden, of het idee laten schieten. of proberen het idee bij FB erin te schieten, maar bij die grote partij vrees ik dat je bot gaat vangen.
 



Overzicht Reageren

 
 

Om de gebruiksvriendelijkheid van onze website en diensten te optimaliseren maken wij gebruik van cookies. Deze cookies gebruiken wij voor functionaliteiten, analytische gegevens en marketing doeleinden. U vindt meer informatie in onze privacy statement.