нужен php разработчик (серч система)
нужен php разработчик (серч система)
Нужен разработчик. Знания:
1. html, css
2. php (MVC, ооп)
3. mysql
4. javascript + jquery
5. redis или аналоги
6. sphinx
7. понимание базового администрирования, nginx.
Ну и так далее.
З/п по уровню знаний. Удаленно. Можно на пол дня. Оплата поэтапная. По деньгам нужно говорить. Присылайте портфолио, опыт работ и тп.
Для написания проекта с нуля на yii. Специфическая поисковая система. Много парсинга, боты. Ожидаемая база данных на примерно 30 миллионов позиций (около 100 млн страниц у сайтов). Около 30 доменов для индексирования.
А также на поддержку существующих проектов (самопис).
Пишите в личку.
1. html, css
2. php (MVC, ооп)
3. mysql
4. javascript + jquery
5. redis или аналоги
6. sphinx
7. понимание базового администрирования, nginx.
Ну и так далее.
З/п по уровню знаний. Удаленно. Можно на пол дня. Оплата поэтапная. По деньгам нужно говорить. Присылайте портфолио, опыт работ и тп.
Для написания проекта с нуля на yii. Специфическая поисковая система. Много парсинга, боты. Ожидаемая база данных на примерно 30 миллионов позиций (около 100 млн страниц у сайтов). Около 30 доменов для индексирования.
А также на поддержку существующих проектов (самопис).
Пишите в личку.
Последний раз редактировалось pgamaster 2013.11.14, 14:26, всего редактировалось 6 раз.
Re: php разработчик (серч система)
чего?Ожидаемая база данных на примерно 30 миллионов
Re: php разработчик (серч система)
Уникальных элементов. В общем приведены примерные данные по объему информации.
Re: php разработчик (серч система)
да похоже на такое объявления вряд ли кто то откликнетсяpgamaster писал(а):Уникальных элементов
Re: php разработчик (серч система)
можно увидеть график зависимости зарплаты от уровня знаний?pgamaster писал(а):Нужен разработчик. Знания:
1. html, css
2. php
3. mysql
4. javascript + jquery
5. redis или аналоги
6. sphinx
7. понимание базового администрирования, nginx.
Ну и так далее.
з/п по уровню знаний
Re: php разработчик (серч система)
Почему? Сильно сложный проект?vdorosh писал(а):да похоже на такое объявления вряд ли кто то откликнетсяpgamaster писал(а):Уникальных элементов
Re: php разработчик (серч система)
Я думаю, что нужно подробней описать, что именно Вы хотите. Так как полноценная поисковая система - это сложный и требующий больших затрат проект.
Re: php разработчик (серч система)
Ну если коротко то сайт подобный этому __http://www.filestube.com/alexzv писал(а):Я думаю, что нужно подробней описать, что именно Вы хотите. Так как полноценная поисковая система - это сложный и требующий больших затрат проект.
А по сути это набор краулеров (сразу 30 никто не будет писать, начнем с 3-5), анализ собранных данных, и выдача по поиску результатов.
Re: php разработчик (серч система)
Кастомный краулер под сайт обычно означает точное знание, в какой чисти страницы (или DOM-а) находится требуемая информация. Все что после этого требуется - нормализация этих данных. Зачем там shpinx?pgamaster писал(а):alexzv писал(а): А по сути это набор краулеров (сразу 30 никто не будет писать, начнем с 3-5).
Вёбных дел мастер
Re: php разработчик (серч система)
Для поиска по сайту. Ну это все элементарно имхо для нормального программиста. Можно и не использовать shpinx если будут более рациональные предложения.alekciy писал(а):Кастомный краулер под сайт обычно означает точное знание, в какой чисти страницы (или DOM-а) находится требуемая информация. Все что после этого требуется - нормализация этих данных. Зачем там shpinx?pgamaster писал(а):alexzv писал(а): А по сути это набор краулеров (сразу 30 никто не будет писать, начнем с 3-5).
По поводу краулера, к чему это? )
Re: php разработчик (серч система)
Эм... тогда я не понял, зачем тут нужны какие-то особые краулеры. Если просто поиск по сайту, то контент можно получить тем же wget-ом и скормить его sphinx-у, на сколько я помню он переваривает xml. Хотя тот же склероз напоминает, что последний требует описание источника в конфиге... Кстати, хорошие поисковые движки были задолго до sphinx-а. Рекомендую посмотреть на Solr от Apache. В контексте последних есть даже готовые краулер Nutch которые может работать с Solr в связке.pgamaster писал(а):Для поиска по сайту. Ну это все элементарно имхо для нормального программиста.
Solr+Nutch скорее всего может оказаться более предпочтительным. Из возможных "минусов" меньшая степень распиаренности в рунете (меньше материалов на русском), написан на Java.pgamaster писал(а): Можно и не использовать shpinx если будут более рациональные предложения.
Это к "начнем с 3-5". Фраза как бы намекает, что предполагаются кастомные краулеры написанные под конкретные ресуры. К примеру, такой нужен для выкачивания каталога, когда нас интерисуют параметры товара (цена) и не интерисует весь остальный контент страницы. В этом случае точно известно положение этих данных на странице и их тип. Поэтому данных можно сразу пихать в базу, sphinx тут мало нужен тогда. С другой стороны если требуется полнотекстовой поиск по сайту, то "начнем с 3-5" краулеров не нужно, т.к. тупо скачку данных без проблем выполняет тот же wget (который, кстати, делает это на отлично), после чего контент страницы можно просто закинуть в поисковые движок (xml/html->DOM->body->textContent).pgamaster писал(а):По поводу краулера, к чему это? )
Вёбных дел мастер
Re: нужен php разработчик (серч система)
В принципе подойдет универсальный краулер если его грамотно написать (по типу гугл бота). Я мало знаком с возможностями Wget , возможно и он подойдет (по сути готовый бот).
В общем это все можно и _нужно_ обсуждать. Ваша мысль мне понятна... но не до конца. Я себе немного по другому это представлял.
Sphinx я планировал использовать как поисковый движок на сайте.
alekciy, вы хотите взяться за работу?
В общем это все можно и _нужно_ обсуждать. Ваша мысль мне понятна... но не до конца. Я себе немного по другому это представлял.
Sphinx я планировал использовать как поисковый движок на сайте.
alekciy, вы хотите взяться за работу?
Re: нужен php разработчик (серч система)
Давайте напишем Гугл на php, wget и sphinx!
Re: нужен php разработчик (серч система)
давайтеanton44eg писал(а):Давайте напишем Гугл на php, wget и sphinx!
Re: нужен php разработчик (серч система)
А как? Могу пояснить непонятные моменты.pgamaster писал(а):Ваша мысль мне понятна... но не до конца. Я себе немного по другому это представлял.
Из коробки это невозможно, ведь sphinx не более чем движок с полнотекстовым поиском с учетом формологии. Он не может сам качать страницы, все что он может вернуть идентификаторы документов которые он считает релевантными.pgamaster писал(а):Sphinx я планировал использовать как поисковый движок на сайте.
Прямо вот в данный момент нет. У меня у самого пачка парсеров недопиленных в разработке. Но потенциально интересно.pgamaster писал(а):alekciy, вы хотите взяться за работу?
Вёбных дел мастер
Re: нужен php разработчик (серч система)
Задача вполне реализуемая. Ни что же не мешает фейсбуку Другой вопрос, что для этой задачи указанная связка сильно неоптимальное решение в плане стоимости владения относительно качества выдачи.anton44eg писал(а):Давайте напишем Гугл на php, wget и sphinx!
Вёбных дел мастер
Re: нужен php разработчик (серч система)
Так Sphinx не будет ничего парсить) Он будет просто выдавать результаты поиска юзеру. Для начала нужно собрать базу а поиск прикрутить это дело десятое.
Я предполагаю сперва собрать базу пауками. Затем уже на сайте проекта будет поиск. А о чем вы говорите я не понял)
Я предполагаю сперва собрать базу пауками. Затем уже на сайте проекта будет поиск. А о чем вы говорите я не понял)
Re: нужен php разработчик (серч система)
Так давайте и ОС писать на PHP! Ни что же не мешает фейсбуку
Re: нужен php разработчик (серч система)
Я говорю о том, что специализированный паук с встроенным парсером может данные забирать о которых он знает. И распихивать их в базу. И Sphinx тут нужен только если сграбленные данные это большие куски текста.pgamaster писал(а):Я предполагаю сперва собрать базу пауками. Затем уже на сайте проекта будет поиск. А о чем вы говорите я не понял)
Если нужен Sphinx индексирующий полностью странички, то специализированный паук с настраиваемым парсером не нужен. По сути нужна тупо качалка бегающая по ссылкам. Но тогда мне не понятно требование по написанию таких парсеров.
Просто требования писаные крайне расплывчато (не говоря уже про redis). Поэтому я пытаюсь выяснить, что же нужно на самом деле. Что бы не получилось, что нужен просто банальный поиск на сайте. Когда клиент по ходу узнает, что можно к сайту прикрутить поиск от яндекса. И сливается. Логичнее это выяснить изначально и уж если так, направить на путь истинный. Кстати, могу еще дать подсказку. От Яндекса есть такой проект как Яндекс.Сервер. Свободный, можно поставить на свой сервак.
Вёбных дел мастер
Re: нужен php разработчик (серч система)
А почему нет. just for fun. Только без меня. И это уже полный офтопик.anton44eg писал(а):Так давайте и ОС писать на PHP! Ни что же не мешает фейсбуку
P.S. Веселее это делать на JS.
Вёбных дел мастер