网站导航网学 原创论文 原创专题 网站设计 最新系统 原创论文 论文降重 发表论文 论文发表 UI设计定制 论文答辩PPT格式排版 期刊发表 论文专题
返回网学首页
网学原创论文
最新论文 推荐专题 热门论文 论文专题
当前位置: 网学 > 设计资源 > 正则表达式 > 正文

php正则表达式提取网页超级链接url的函数

论文降重修改服务、格式排版等 获取论文 论文降重及排版 论文发表 相关服务

网学网正则表达式编辑为广大网友搜集整理了:php 正则表达式提取网页超级链接url的函数绩等信息,祝愿广大网友取得需要的信息,参考学习。

复制代码 代码如下:
function match_links($document) {
preg_match_all("''<\s*a\s.*?href\s*=\s*([\"\''])?(?(1)(.*?)\\1|([^\s\>]+))[^>]*>?(.*?)</a>''isx",$document,$links);
while(list($key,$val) = each($links)) {
if(!empty($val))
$match[''link''][] = $val;
}
while(list($key,$val) = each($links)) {
if(!empty($val))
$match[''link''][] = $val;
}
while(list($key,$val) = each($links)) {
if(!empty($val))
$match[''content''][] = $val;
}
while(list($key,$val) = each($links[0])) {
if(!empty($val))
$match[''all''][] = $val;
}
return $match;
}

主要是正则的问题,下面给出个asp.net下的,多测试正则
获取页面的链接正则
复制代码 代码如下:
public string GetHref(string HtmlCode)
{
string MatchVale = "";
string Reg = @"(h|H)(r|R)(e|E)(f|F) *= *(''|"")?((\w|\\|\/|\.|:|-|_)+)(''|""| *|>)?";
foreach (Match m in Regex.Matches(HtmlCode, Reg))
{
MatchVale += (m.Value).ToLower().Replace("href=", "").Trim() + "||";
}
return MatchVale;
}
设为首页 | 加入收藏 | 网学首页 | 原创论文 | 计算机原创
版权所有 网学网 [Myeducs.cn] 您电脑的分辨率是 像素
Copyright 2008-2020 myeducs.Cn www.myeducs.Cn All Rights Reserved 湘ICP备09003080号 常年法律顾问:王律师