php 采集小程序,做采集的必看
/iUs";//正则 preg_match_all($pattern, $fcourses, $arr); //print_r($arr); foreach($arr[1] as $k=>$url) { $title = iconv('GB2312', 'UTF-8', addslashes($arr[2][$k])); // echo $title; // echo $url; $str = iconv("GB2312","UTF-8", file_get_courses($url)); $author = preg_substr("/作者:/", "/<\//", $str); // 通过正则提取作者 $course = str_substr('', '', $str); //通过字符串提取标题 $sql = "INSERT INTO `caiji` (`title`, `url` , `course`, `author` ) VALUES ('$title', '$url' , '$course' , '$author')"; // echo $sql."
"; mysql_query($sql); } $id++; echo "正在采集URL数据列表$id...请稍后..."; echo ""; } else{ echo "采集数据结束。"; } ?>
其中 title 设置唯一,可以防止重复采集,很好的的一个php采集小程序