뉴질랜드 다이어리(NZ Diary) 라빠

Web Scrapping with Python, PHP, Javascript 본문

개발

Web Scrapping with Python, PHP, Javascript

Donochi 2017. 2. 13. 10:02


세가지 언어로 동일한 기능을 수행해 봄으로서 세 언어의 특징과 장단점을 살펴볼 수 있을것 같다.


간단한 Web Scrapping 코드를 각 언어로 구현하면 아래와 같다.


[Python]

from lxml import html

page = "<html><body><ul><li>First Item</li><li>Second Item</li></ul></body></html>"

tree = html.fromstring(page)

items = tree.xpath('//li/text()')


[PHP]

$page = "<html><body><ul><li>First Item</li><li>Second Item</li></ul></body></html>";

$doc = new DOMDocument();

$doc -> loadHtml($page);

$xpath = new DOMXPath($doc);

$items = $xpath -> query('//li/text()'); 


[Javascript]

var xpath = require('xpath');

var dom = require('xmldom').DOMParser;

var page = "<html><body><ul><li>First Item</li><li>Second Item</li></ul></body></html>";

var doc = new don().parseFromString(page);

var items = xpath.select('//li/text()', doc);


결론적으로, 

- Python 이 역시 Web Scrapping 에는 최적화 되어있는것으로 보인다. 문법역시 깔끔하다.

- PHP 는 가장 많이 사용되는 서버 언어이긴 하지만, 상당히 번거롭다.

- Javascript 는 일단, Javascript 자체로 먹고 들어가는 부분이 있다. 


역시..Python 인가..ㅋㅋ