Вытаскивание ссылок (УРЛ-ов) со страницы и проверка доменов на занятость

Скрипт предназначен для вытаскивания гиперссылок с страницы в интернете и проверки домена, на который указывает гиперссылка, на занятость. Скрипт делался на основе двух скриптов.


#!/usr/bin/perl

use LWP::Simple;

$URL="http://yaca.yandex.ru/yca/cat/Computers/";
print "Content-type: text/html\n\n";
$_ = get($URL);

for (split /\n/){
if(/(.*)(http:\/\/(www.)?([\w\d][\w\d-]+\.ru))(.*)/ and !(/yandex/)) {
@u=(@u,"$4\n")
}
}

for (@u){
print "---------------
$_
";
open (IX,"/usr/bin/whois $_ |");
while ()
{
chop $_;
# if (/domain:/) {print "$_\n"};
# if (/state:/) {print "$_\n"};
print "$_\n";
}

}