prowebber.ru - Тут есть все для настоящих вебмастеров

Чтение RSS Мы в твиттере
«    Декабрь 2016    »
ПнВтСрЧтПтСбВс
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
 

Всё для вебмастера » Всё для uCoz » Универсальный граббер с DLE сайтов на uCoz (модуль новости)

Универсальный граббер с DLE сайтов на uCoz (модуль новости)


Данный материал предоставлен сайтом ProWebber.ru исключительно в ознакомительных целях. Администрация не несет ответственности за его содержимое.
У нас вы можете скачать бесплатно Универсальный граббер с DLE сайтов на uCoz (модуль новости).


Описание:
Универсальный граббер с DLE сайтов на uCoz (модуль новости)

Краткое инфо по пользованию граббера:

1. Требования к хостингу
Версия PHP >= 5;
Должна присутствовать библиотека iconv;
Хостинг должен быть с поддержкой сокетов.

2. Установка
1) Залейте содержимое скрипта на хостинг.
2) Установите на директорию cache права на запись(chmod 777).

3. Настройка
Откройте файл config.php
Впишите ваш домен на укозе:
$_cfg['ucoz']['site'] = 'www.ru';


Установите логин администатора/модератора/репортера и его пароль:

$_cfg['ucoz']['login'] = 'lavrik';
$_cfg['ucoz']['password'] = '785fgsd24asd';


3. Как пользоваться?

Зайдите через браузер http://your_site.ru/grabber_path/
В поле about:blank впишите адрес DLE сайта с которого будите граббить и жмите энтер

В новой версии реализовано:
Возможность использовать синонимайзер
Возможность создавать правила для граббинга с любых сайтов(подобных DLE)

Исправленно:
Ставить ссылки в теги
<noindex></noindex>
$_cfg['grabber']['savecontents'] = TRUE; // TRUE - вкл. FALSE - выкл.
Возможность создавать правила для граббинга с любых сайтов(подобных DLE)

Как пропускать содержимое новостей через синонимайзер:

ГЛАВНОЕ: для того чтоб вы могли использовать данную опцию у вас должен быть синонимайзер! Я рекомендую http://smartbyte.org
1) Установите в конфиге
$_cfg['grabber']['savecontents'] = FALSE;

на
$_cfg['grabber']['savecontents'] = TRUE;

2) Установите на директорию contents права на запись(chmod 777)
3) Добавляйте новости как раньше они появятся в папке contents (!! кодировка файлов будет в UTF-8 !!)
4) Пропустите содержимое директории contents через синонимайзер
5) Зайдите через браузер в http://your_site.ru/grabber_path/ на главной странице будет ссылка Залить контент нажмите ее. И ожидайте пока контент будет заливается

Как создавать правила для граббинга с любых сайтов:

1) Откройте файл mysites.txt
2) korrespondent.net меняете на сайт который будите граббить
3) Заходите на главную страницу нажимаете просмотр HTML кода ищите HTML фрагмент который повторяется
допустим это
<div id='news-id
и его закрывающий элемент допустим это
</td></tr>

Между ними поставьте (.*)
Получится
<div id='news-id(.*)</td></tr>

4) [title], [small], [fulllink], [full] - работает по тому же принципу что и [style]
5) [qpage] Фрагмет HTML кода со страницами
Ищет последнюю страницу страницу автоматически
6) [page] - url формат страниц
Например, есть ссылка - http://0day.kiev.ua/modules.php?name=News&pagenum=2
Формат [page] Будет такой http://0day.kiev.ua/modules.php?name=News&pagenum=(.*)
7) Список функций и их предназначение:
@striptags - Ф-ция удаляет теги
@clean - Ф-ция удаляет лишние пробелы, табуляции и тд.
@htmltobb - Ф-ция преобразует HTML код в BB коды
@rm(value) - Ф-ция удаляет содержимое value с текста (например ...)
Описание функций: @a, @a.ТЕГ, @a(текст)б @restart и @emptyhtml
Допустим вам надо поставить имя автора в начале текста или в конце
Например:
<td>Автор: Vasya</td></tr><tr><td><div id='news-2412'>Новость: текст текст текст</div>

То для того чтоб поставить автора в начало необходимо выполнить такие команды
[full]
@a([b ]Автор:[/b ])
Автор: (.*)</td>
@a
@restart
id='news-(.*)</div>
'>Новость: (.*)
@a.center
@emptyhtml

Ф-ция @a - выполняет добавление содержимого в поток
Ф-ция @a.center - выполнит добавление в поток + содержимое будет в тегах Ф-ция @restart - загрузит нетронутый HTML код ( после выполнения команды Автор: (.*) текст для обработки будет Vasya для того чтоб он обрел первичный вид:
<td>Автор: Vasya</td></tr><tr><td><div id='news-2412'>Новость: текст текст текст</div>


надо выполнить команду @restart )
Ф-ция @emptyhtml - в конце обработки сценария [small], [full], [title] обработанный текст автоматически добавляется в поток для того чтоб этого не случилось , используйте данную функцию
Если сайт в кодировке UTF-8 то следует использовать функцию @utf
8) Ну это, пожалуй и все запускайте браузер вводите http://your_site.ru/grabber_path/ и начинайте граббить сайт

Внимание! У вас нет прав для просмотра скрытого текста.


0
Просмотры: 36115 VIP ProWebber | Комментарии (8)
Теги: grabber, парсер
Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь.
Мы рекомендуем Вам зарегистрироваться либо войти на сайт под своим именем.

#1FTN

  • 21 января 2010 16:35
  • Регистрация: 30.09.2009
  • ICQ: 1307078
  • Комментариев: 91
Кто заюзал уже?? мне кажется не будет работать...

--------------------

0

#2MysterIoes

  • 21 января 2010 18:59
  • Регистрация: 22.11.2009
  • ICQ: --
  • Комментариев: 356
Цитата: FTN
Кто заюзал уже?? мне кажется не будет работать...

Прочитайте эту новость http://prowebber.ru/news/2165-chitat-vsem.html
имхо я в последние время очень добрый diablo

0

#3sewa

  • 30 января 2010 00:30
  • Регистрация: 29.01.2010
  • ICQ: --
  • Комментариев: 47
Пытался работать с этим граббером, но его особенность - не у всех идет
У меня не пошло, а у друга на "ура" работает!
видимо из за самописности кода не со всеми параметрами совместим =(

0

#4SNIPER32

  • 8 февраля 2010 01:13
  • Регистрация: 19.09.2009
  • ICQ: --
  • Комментариев: 100
Странно не заню как у вас но сколько я не пытался запустить этот граббер не работает ваще

0

#5filinua

  • 28 октября 2010 23:44
  • Регистрация: 19.10.2010
  • ICQ: --
  • Комментариев: 27
И чо теперь чмыри с юкоса будут наши сайты грабить,да не дадим в обиду ДЛЕ , ДАВАЙ НАОБОРОТ ПАРСЕРЫ

0

#6koxakos

  • 29 апреля 2011 00:33
  • Регистрация: 13.02.2011
  • ICQ: --
  • Комментариев: 1
все работает то просто у кого-то ручки не с того места

0

#7SalTok

  • 19 июля 2011 20:53
  • Регистрация: 13.09.2010
  • ICQ: --
  • Комментариев: 22
все работает то просто у кого-то ручки не с того места

axaxaxa

0

#8AcSeL29

  • 17 мая 2014 20:08
  • Регистрация: 12.11.2010
  • ICQ: --
  • Комментариев: 1
Наполню сайт на ucoz новостями с выбранного DLE сайта.
Заинтересовало-пишите blush

http://vk.com/id184670789

0
Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии в данной новости.

Max-energy.top - Заработок на электросчетчиках;)

Skripters.info - все для вебмастера. Только эксклюзивный контент.

Создание шаблонов DLE, быстро и недорого! 3wave.com.ua

Бро лей на лучшую партнёрку

Почти бесплатный VDS хостинг!

Поддержи сайт
Скрипты, cms, шаблоны, статьи по раскрутке

Опросы

Как часто вы бываете на сайте?

Захожу 1-2 раза в день
1-2 часа в сутки
Более 2 часов
Почти целый день тут smile

Архив новостей
Ноябрь 2016 (7)
Октябрь 2016 (10)
Сентябрь 2016 (8)
Август 2016 (11)
Июль 2016 (14)
Июнь 2016 (17)

Последние комментарии:

Искать людей

Ваши переписки