网站导航网学 原创论文 原创专题 网站设计 最新系统 原创论文 论文降重 发表论文 论文发表 UI设计定制 论文答辩PPT格式排版 期刊发表 论文专题
返回网学首页
网学原创论文
最新论文 推荐专题 热门论文 论文专题
当前位置: 网学 > 设计资源 > .Net编程 > 正文

提取HTML代码中的网址

论文降重修改服务、格式排版等 获取论文 论文降重及排版 论文发表 相关服务

// 提取HTML代码中的网址
    static ArrayList GetHyperLinks(string htmlCode)
    {
        ArrayList al = new ArrayList();
        string strRegex = @"http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?";
        Regex r = new Regex(strRegex, RegexOptions.IgnoreCase);
        MatchCollection m = r.Matches(htmlCode);
        for (int i = 0; i <= m.Count - 1; i++)
        {
            bool rep = false;
            string strNew = m[i].ToString();
            // 过滤重复的URL
            foreach (string str in al)
            {
                if (strNew == str)
                {
                    rep = true;
                    break;
                }

            }

            if (!rep) al.Add(strNew);
        }

        al.Sort();
        return al;
    }

  • 上一篇资讯: 过滤字符串中的html标签
  • 设为首页 | 加入收藏 | 网学首页 | 原创论文 | 计算机原创
    版权所有 网学网 [Myeducs.cn] 您电脑的分辨率是 像素
    Copyright 2008-2020 myeducs.Cn www.myeducs.Cn All Rights Reserved 湘ICP备09003080号 常年法律顾问:王律师