Kako Napraviti Parser

Sadržaj:

Kako Napraviti Parser
Kako Napraviti Parser

Video: Kako Napraviti Parser

Video: Kako Napraviti Parser
Video: КАК СДЕЛАТЬ ПАРСЕР | PYTHON 2024, Svibanj
Anonim

Raščlanjivanje je jedna od široko korištenih tehnika u programiranju web stranica. To vam lako i jednostavno omogućuje da putem malog broja naredbi dobijete potrebnu uslugu web mjesta, kada ne postoji mogućnost da sami napišete potrebnu skriptu.

Kako napraviti parser
Kako napraviti parser

Upute

Korak 1

Najjednostavniji način raščlanjivanja je pomoću PHP funkcije file_get_contents (). Omogućuje vam dobivanje sadržaja datoteke u obliku tekstualnog niza. Funkcija koristi algoritam "mapiranje memorije", koji poboljšava njegove performanse.

Korak 2

Na primjer, da biste napisali skriptu koja raščlanjuje podatke s web mjesta Centralne banke Ruske Federacije, morate dobiti sadržaj XML stranice pomoću odgovarajuće funkcije, prethodno definirajući datum u formatu koji odgovara web mjestu, a zatim pomoću regularnih izraza podijeliti ga. Za prikaz odabrane valute koristi se kod dobiven na web mjestu Banke: $ data = date (“d / m / Y”); $ get = file_get_contents (https://www.cbr.ru/scripts/XML_daily.asp ? date_req = $ podaci); preg_match ("/(.*?)/ is", $ get, $ string); preg_match ("/(.*?)/ is", $ string [1], $ str);

3. korak

Ako želite raščlaniti samu XML datoteku, za to postoje i odgovarajuće funkcije. Da biste pokrenuli parser, trebate ga inicijalizirati pomoću xml_parser_create: $ parser = xml_parser_create ();

4. korak

Tada je naveden popis funkcija koje će obrađivati odgovarajuće oznake i tekstualne informacije. Postavljeni su odgovarajući obrađivači početka i kraja XML elementa: xml_set_element_handler ($ parser, “startElement”, “endElement”);

Korak 5

Podaci se mogu čitati pomoću standardnih funkcija fopen () i fgets () unutar odgovarajuće petlje. Sadržaj datoteka vraća se redak po redak u xml_parse (). Posljednji parametar sadrži zastavicu čitanja zadnjeg retka: while ($ content = fgets ($ fparse)) {

if (! xml_parse ($ parser, $ content, feof ($ fparse)))) {

odjek "Pogreška";

pauza; }}

Korak 6

Funkcija xml_parser_free () koristi se za oslobađanje resursa koje sustav zauzima. Te su funkcije najsnažnije pri obradi XML datoteka.

Preporučeni: