类似网址abc.site.com site.com/abc ,www.site.com.cn , site.com.tw ,www.site.co.uk ,www.site.com.jp/abc.php/id=abc
如何用PHP正则获取所有网址的一级域名?获得结果为 abc.com,abc.com.cn, abc.co.uk?
下面的代码,只能匹配部分情况,当域名里有com,net,org,gov,cc,biz,info,cn,co时,正则出的结果不准确。比如www.cool.com,被正则成了www.co。
$url = $row[“url”];
preg_match(“#[\w-]+\.(com|net|org|gov|cc|biz|info|cn|co)(\.(cn|hk|uk))*#”, $url, $match);
echo $match[0];
如下提供一种万能正则表达式,匹配各种情况Url一级域名
$s = <<< TEXT
abc.abc.com
abc.com/abc
www.abc.com.cn
abc.com.tw
www.abc.co.uk
www.abc.com.jp/abc.php/id=abc
www.cool.com
TEXT;
foreach(split(“[\r\n]+”, $s) as $url) {
preg_match(“#[\w-]+\.(com|net|org|gov|cc|biz|info|cn|co)\b(\.(cn|hk|uk|jp|tw))*#”, $url, $match);
echo “<p>$url <br />” . $match[0];
}
上述情况解决:
www.abc.com.jp/abc.php/id=abc
abc.com.jp
www.cool.com
cool.com