граббер на php
- Ghost_nsk
- Сообщения: 825
- Зарегистрирован: 2012.01.01, 00:45
- Откуда: Новосибирск
- Контактная информация:
граббер на php
народ посоветуйте универсальное решение
Re: граббер на php
Самое лучшее решение на мой взгляд phpQuery. Синтаксис запросов как у jQuery
- Ghost_nsk
- Сообщения: 825
- Зарегистрирован: 2012.01.01, 00:45
- Откуда: Новосибирск
- Контактная информация:
Re: граббер на php
ништячок, то что надо, особенно за jquery спасибоandipas писал(а):Самое лучшее решение на мой взгляд phpQuery. Синтаксис запросов как у jQuery
Re: граббер на php
писал граббер на php. Использовал curl и phpQuery. Проблемы с утечечкой памяти и некоторые проблемы с curl достали, переписал на python с requests и pyquery (порт JQuery на питон, фактически аналог phpQuery)
- Ghost_nsk
- Сообщения: 825
- Зарегистрирован: 2012.01.01, 00:45
- Откуда: Новосибирск
- Контактная информация:
Re: граббер на php
поподробнее если можноanton44eg писал(а):Проблемы с утечечкой памяти
Re: граббер на php
нужно было проходить довольно много страниц. Curl тёк довольно сильно, phpQuery севсем немного. Это как мне удалось выяснить )
Re: граббер на php
Парсил 50к+ страниц, брал страницу через Zend_Http_Client, а парсил через phpQuery. Все отлично.
p.s. Zend_Http_Client по умолчанию через сокеты работает.
p.s. Zend_Http_Client по умолчанию через сокеты работает.
Re: граббер на php
А какая версия php? У меня после 5к страниц уже процесс php перерастал все мыслимые обьемы. Сначала винил AR, сделал без AR, ситауация не менялась
Zend_Http_Client - обёртка над curl?
Zend_Http_Client - обёртка над curl?
Re: граббер на php
У Zend_Http_Client можно менять тип подключения, с помощью адаптеров. По умолчанию он использует Zend_Http_Client_Adapter_Socket, тобиж fsockopen. А можно и курл Zend_Http_Client_Adapter_Curl. Я использовал сокеты. PHP 5.3.5.
Re: граббер на php
ага, спасибо. как-нибудь попробую. у него есть средства для распараллеливания запросов?
Re: граббер на php
Нет, насколько мне известно.anton44eg писал(а):у него есть средства для распараллеливания запросов?
Re: граббер на php
Решение для многопоточных запросов, Zend_Http_Client и multi_curl - http://it-giki.com/post/205.html