[PHP] Vraag over simple html dom
Ik probeer via simple html dom de inhoud van een Facebookbericht te scrapen, maar ik kom er niet uit..
Code (php)
1
2
3
4
5
6
7
8
9
2
3
4
5
6
7
8
9
ini_set('user_agent', 'MyBrowser v42.0.4711');
include 'htmldom/simple_html_dom.php';
// DOM opslaan in variabele
$html = file_get_html(':https://www.facebook.com/facebookapp/posts/10159137047256729');
$a = $html->find('div[data-testid=post_message]');
echo $a->plaintext;
include 'htmldom/simple_html_dom.php';
// DOM opslaan in variabele
$html = file_get_html(':https://www.facebook.com/facebookapp/posts/10159137047256729');
$a = $html->find('div[data-testid=post_message]');
echo $a->plaintext;
Weet iemand wat ik verkeerd doe?
Wat is er eigenlijk mis met de API?
- Ariën - op 22/02/2020 09:17:58:
Wat is er eigenlijk mis met de API?
Daarmee kun je zonder pagetoken met toegang tot de betreffende pagina, geen recensies scrapen van andere Facebookpagina’s. Alleen van je eigen Facebookpagina.
Is het die dubbele punt voor de URL?
Gewijzigd op 22/02/2020 14:30:01 door - Ariën -
- Ariën - op 22/02/2020 14:24:45:
Maar waar loop je op vast?
Is het die dubbele punt voor de URL?
Is het die dubbele punt voor de URL?
Jeetje, scherp haha! De dubbele punt is weggehaald, maar krijg eigenlijk nog geen output te zien met deze code :O
Weet jij misschien waarom er geen output te zien is? In de broncode van die pagina, móet die DIV wel bestaan uit de inhoud van het bericht
Probeer anders het omvattende code-blok eens op te vragen (<code id="u_0_1m">...</code>) en kijk wat ie daarvan retourneert?
Kan je iets vinden in een simpele var_dump?
- Ariën - op 23/02/2020 01:30:33:
Kan je iets vinden in een simpele var_dump?
dan krijg ik helaas een lege output.. :-(
En een stapje terug, op $html?
Het bericht wordt pas later ingeladen en zelfs met xpath comment() blijft deze leeg.
Edit Ah plaatjes werken niet meer.... KLIK
Gewijzigd op 24/02/2020 17:29:51 door Michael -
Gaat via een AJAX-request dus. Of ze dit bewust als blokkade doen weet ik niet. Maar ik denk dat het toch API werk zal worden, of het idee laten schieten. of proberen het idee bij FB erin te schieten, maar bij die grote partij vrees ik dat je bot gaat vangen.