五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

使用網(wǎng)絡(luò)爬蟲自動抓取長江水位和流量數(shù)據(jù)

2020-11-30 12:45 作者:ocean_tide  | 我要投稿

如下圖所示,我們要從這個(gè)網(wǎng)站抓取長江主要站點(diǎn)的水位和流量數(shù)據(jù)。

首先使用urlread讀取網(wǎng)頁的內(nèi)容,再找到數(shù)據(jù)所在的字符串

str=urlread('http://www.cjh.com.cn/sssqcwww.html')
以向家壩為例,1710就是流量,266.22是水位
'{"oq":"0","q":"1710","rvnm":"長江","stcd":"60103400","stnm":"向家壩","tm":1606701600000,"wptn":"5","z":"266.22"}'
接著我們使用正則化表達(dá)來提取這些數(shù)據(jù)
flow=regexp(str,'{"oq":"0","q":"\d*','match');? %提取流量 單位是m3/s
wl=regexp(str,'"wptn":"\d","z":"\S{2,10}"}','match'); %提取水位 單位是米
name=regexp(str,'"stnm":"\S{2,10}","tm":','match'); %提取觀測站點(diǎn)名字
完整的程序如下,該程序會每小時(shí)運(yùn)行一次,抓取數(shù)據(jù)并保存成mat文件:

j=1; %網(wǎng)站數(shù)據(jù)是逐時(shí)的,整點(diǎn)會更新,為了預(yù)防可能出現(xiàn)的延遲問題,建議12點(diǎn)的數(shù)據(jù)12點(diǎn)15分時(shí)才去爬取
while 0<1
?time(j,:)=datestr(now);
str=urlread('http://www.cjh.com.cn/sssqcwww.html');
%str1='{"oq":"0","q":"1710","rvnm":"長江","stcd":"60103400","stnm":"向家壩","tm":1606701600000,"wptn":"5","z":"266.22"}'
flow=regexp(str,'{"oq":"0","q":"\d*','match');? %流量 單位是m3/s
wl=regexp(str,'"wptn":"\d","z":"\S{2,10}"}','match'); %水位 單位是米
name=regexp(str,'"stnm":"\S{2,10}","tm":','match'); %觀測站點(diǎn)名字
for i=1:length(flow)
??? d(j,i)=str2num(flow{i}(16:end));? %0代表沒有流量觀測
end

for i=1:length(wl)
??? sl(j,i)=str2num(wl{i}(17:end-2));?
end
j=j+1
save('Yangtze.mat','time','d','sl','name')
pause(3600); %每隔一小時(shí)執(zhí)行一次
end

使用網(wǎng)絡(luò)爬蟲自動抓取長江水位和流量數(shù)據(jù)的評論 (共 條)

分享到微博請遵守國家法律
观塘区| 南城县| 保山市| 乌鲁木齐市| 铜山县| 横峰县| 黔西县| 额济纳旗| 满洲里市| 孟连| 新田县| 略阳县| 凤城市| 密云县| 兰州市| 当阳市| 壤塘县| 吉安县| 巴南区| 慈利县| 扎囊县| 嵊州市| 西乌珠穆沁旗| 宁明县| 米泉市| 琼海市| 壶关县| 板桥市| 茂名市| 元阳县| 肃北| 澄江县| 闵行区| 临西县| 铁岭县| 湘西| 贵德县| 丁青县| 皋兰县| 岳阳市| 上虞市|