写出正则表达式,从一个字符串中提取链接地址 - 高飞网
6人看过

写出正则表达式,从一个字符串中提取链接地址

2014-05-21 01:17:58

写出正则表达式,从一个字符串中提取链接地址。比如下面字符串中
“IT面试题博客中包含很多 软件测试面试题
则需要提取的地址为 “http://www.mianwww.com/html/category/it-interview/softwaretest ”

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Regex {

static void url() {

String input = “IT面试题博客中包含很多 软件测试面试题 “;
Pattern pattern;
Matcher matcher;
pattern = Pattern.compile(“<a(?: [^>]*)+href=([^ >]*)(?: [^>]*)*>”);
matcher = pattern.matcher(input);
while (matcher.find()) {
System.out.println(matcher.group());
}
}

public static void main(String[] args) {
url();
}

}

张无忌

生命不止,奋斗不息
这应该是面试爬虫工程师的,正则是必会的内容。
发布于:2017-08-31 14:22:15.0
54.158.248.167