Code Bye

PHP 通用正则表达式匹配获取各种URL的一级域名

类似网址abc.site.com site.com/abc ,www.site.com.cn , site.com.tw ,www.site.co.uk ,www.site.com.jp/abc.php/id=abc
如何用PHP正则获取所有网址的一级域名?获得结果为 abc.com,abc.com.cn, abc.co.uk?
下面的代码,只能匹配部分情况,当域名里有com,net,org,gov,cc,biz,info,cn,co时,正则出的结果不准确。比如www.cool.com,被正则成了www.co。

$url = $row[“url”];
preg_match(“#[\w-]+\.(com|net|org|gov|cc|biz|info|cn|co)(\.(cn|hk|uk))*#”, $url, $match);
echo $match[0];
如下提供一种万能正则表达式,匹配各种情况Url一级域名
$s = <<< TEXT
abc.abc.com
abc.com/abc
www.abc.com.cn
abc.com.tw
www.abc.co.uk
www.abc.com.jp/abc.php/id=abc
www.cool.com
TEXT;

foreach(split(“[\r\n]+”, $s) as $url) {
preg_match(“#[\w-]+\.(com|net|org|gov|cc|biz|info|cn|co)\b(\.(cn|hk|uk|jp|tw))*#”, $url, $match);
echo “<p>$url <br />” . $match[0];
}
上述情况解决:
www.abc.com.jp/abc.php/id=abc
abc.com.jp

www.cool.com
cool.com


CodeBye 版权所有丨如未注明 , 均为原创丨本网站采用BY-NC-SA协议进行授权 , 转载请注明PHP 通用正则表达式匹配获取各种URL的一级域名