Back to Question Center
0

Tiwtorial Scraper Web Chrome O Semalt Expert

1 answers:

Os ydych chi'n defnyddio Google Chrome, mae estyniad i'ch porwr a all helpu i dorri tudalennau gwe. Fe'i gelwir yn 'Scrapper,' 'a gellir ei ddefnyddio heb broblemau. Bydd Scrapper yn helpu i graffu cynnwys gwefan a llwytho'r canlyniadau i ddogfennau Google.

Sut i dorri gwefan gan ddefnyddio estyniad Scraper?

1. Dewiswch Chrome Web Store yn Google Chrome;

2. Mewn estyniadau, gwnewch chwiliad am '' Scrapper '';

3. Y canlyniad chwiliad cyntaf yw'r estyniad a elwir yn '' Scrapper '';

4. Dewiswch y botwm a restrir fel '' Ychwanegu at Chrome ';

5. Ewch yn ôl at restr ASau y DU;

6. Cliciwch y canlynol dolen ;

7. Nawr edrychwch am un AS a sicrhau bod y cofnod wedi'i farcio;

8. Cliciwch ar y dde i ddewis "Sgrap Yn debyg ... "opsiwn;

9. Bydd y consol ar gyfer sgrapper yn popio mewn ffenestr arall;

10. Edrychwch ar y cynnwys wedi'i grapio yn y sgraper consol;

11. Er mwyn sicrhau bod y cynnwys yn cael ei gadw fel taenlen Google, dewiswch "Save to Google Docs ..."

Sgrapio estynedig

Cyn cadw at y rysáit hon , mae'n ddefnyddiol deall pethau sylfaenol HTML. Er enghraifft, gallwch ddarllen cyflwyniad byr i HTML trwy'r ddolen hon

Gadewch i ni ddychmygu bod gennym ddiddordeb ym mhob ffilm sy'n serenio Asia Argento, actores Eidalaidd enwog.

1. Mae archif manwl iawn o actorion yn IMDB. Gwefan Asia Argento yw: https://www.imdb.com/name/nm0000782/;

2. Yma, gallwch weld yr holl rolau a chwaraeodd yr actores..Gadewch i ni ddechrau dileu'r wybodaeth y mae gennym ddiddordeb ynddo;

3. Ceisiwch ei sgrapio fel y disgrifiwyd uchod;

4. Fe welwch fod y rhestr ychydig yn ystumio. Mae hyn oherwydd y ffaith y gellir strwythuro'r rhestr yma yn wahanol;

5. Ewch i'r consol crafu. Ar y chwith uchaf, fe welwch y blwch bach sy'n dweud XPath;

6. Mae Xpath yn fath o iaith ymholiad sy'n gweithio ar gyfer XML ac HTML;

7. Gall XPath helpu i ddod o hyd i rannau'r dudalen yr ydych yn ddiddordeb ynddo. Y peth nesaf yw dod o hyd i elfen briodol ac ysgrifennwch XPath ar ei gyfer;

8. Nawr, gadewch i ni drefnu ein tabl;

9. Fe welwch fod ein XPath presennol, sydd â'r holl ddata sydd ei hangen, yn "// div [3] / div [3] / div [2] / div";

10. Mae XPath yn hysbysu'r System i weld y doc HTML a dewis y trydydd elfen, yna yr ail elfen ac yna pob un ohonynt;

11. Ond, hoffem gael gwahanu ein data;

12. Defnyddio adran y colofnau yn y consol ar gyfer sgrapper i wneud hyn;

13. Gadewch i ni ganfod yn gyntaf ein teitl РІР,“ Defnyddiwch Elfen Archwilio i weld y teitl;

14. Gwiriwch y teitl o fewn tag. Ychwanegu'r tag i'r XPath;

15. Ymddengys bod yr ymadrodd yn gweithredu'n briodol, felly gwnewch yn ein golofn gyntaf;

16. Yn yr adran "Colofnau", disodli enw'r golofn gyntaf i "title";

17. Ychwanegwch y XPath iddo;

18. Yn yr adran golofn, mae'r XPaths yn gymharol ac mae'n golygu y bydd "./b" yn dewis yr elfen

19. Yn y XPath ar gyfer y golofn teitl, ychwanegwch "./b" a dewis "sgrapio";

20. Nawr, gadewch i ni barhau am flwyddyn. Gellir dod o hyd i flynyddoedd o fewn un rhychwant;

21. Creu colofn newydd trwy ddewis y bachyn bach wrth ymyl y golofn ar gyfer eich teitl;

22. Gan ddefnyddio XPath "./span" creu colofn ar gyfer "year";

23. Cliciwch yn sgrapio a gweld sut ychwanegwyd y flwyddyn;

24. Wedi'i wneud!

December 6, 2017
Tiwtorial Scraper Web Chrome O Semalt Expert
Reply