Наткнулся на прикольную фичу с mail.ru ответатми, оказывается можно потихому парсить адреса тех кто задает вопросы и отвечает на них 🙂
Парсим ответы:
1 |
wget -q -O - http://otvet.mail.ru/open/?pg={1..100} | grep -ioE '\b[A-Z0-9._%+-]+@[A-Z0-9.-]+\.[A-Z]{2,4}\b' | sort -ui >> ./otveti_email.txt |
Парсим ответы “На голосовании”:
1 |
wget -q -O - http://otvet.mail.ru/vote/?pg={1..100} | grep -ioE '\b[A-Z0-9._%+-]+@[A-Z0-9.-]+\.[A-Z]{2,4}\b' | sort -ui >> /home/graff/otveti_email.txt |
далее просто чистим дубликаты:
1 |
cat otveti_email.txt |sort|uniq>otveti_email.txt2 |
Вообще во всей этой технологии парсинга есть один косяк, который сводит все Ваши действия на “НЕТ”, как только начнете слать по такой паршеной базе письма, примерно через пару тройку минут влетить в блек. лист mail.ru, а они деревянные, просто будут сбрасывать подключения от Вас. Кто шарит тот сам проанализирует и поймет о чем я, кто не шарит – учимся….