五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

從韋恩圖看統(tǒng)計編程語言上的 merge/join

2021-07-22 22:27 作者:陸震同學  | 我要投稿

挖了很久的坑,要來回填了。

首先上韋恩圖(Venn Diagram):

無論是SAS,R,Python,Stata,還是SPSS,關(guān)于merge(或者是各種形式的join,如inner join、Cartesian Product)數(shù)據(jù)集的操作原理都是上面的韋恩圖范疇之內(nèi),不同的只是代碼形式。萬變不離其宗。

學習之余來玩一個游戲:

現(xiàn)在我有7個點,或者直接是7個城市,希望你給我做一個每兩個城市之間連線的數(shù)據(jù)集,希望越簡單越好。

這里我們拿 SAS 來做,對于上面其他 4 種統(tǒng)計編程語言,有感興趣的小伙伴可以嘗試做一下。

首先我們隨意給定一個數(shù)據(jù)集:

data cities;
input pointid city $12.;
cards;
1 ? LosAngeles
2 ? Orlando
3 ? London
4 ? NewYork
5 ? Boston
6 ? Paris
7 ? Washington
8 ? LosAngeles
9 ? Orlando
10 ?London
;
run;

proc sql;
?create table discity ?as
?select distinct city
?from cities;
quit;

proc print data=discity;
?title "Distinct Cities";
?format city $12.;
run;

原理上很簡單,7 個城市之間任意兩點連線,是個排列組合問題,對于不重復的連線,應該是7*6/2 =21條。

我們是這么操作的:

proc sql;
? create table pair_cities as
? select f1.city as orig ,
? ? ? ? ?f2.city as dest
? ?from ?discity ?as f1 , discity as f2
? where f1.city ne ' ' & f1.city < f2.city
? order by f1.city, f2.city;
quit;

title 'All Possible Paired Places';
proc print data=pair_cities;
?format orig dest $12.;
run;

鼓勵小伙伴拿其他編程語言也來嘗試一下。



從韋恩圖看統(tǒng)計編程語言上的 merge/join的評論 (共 條)

分享到微博請遵守國家法律
犍为县| 安仁县| 抚顺县| 高碑店市| 砚山县| 丹东市| 广元市| 长寿区| 青海省| 天等县| 徐闻县| 万源市| 隆化县| 营口市| 平阳县| 宜春市| 南昌县| 襄城县| 光山县| 泰州市| 静海县| 马公市| 乌兰察布市| 定结县| 新乡县| 绥宁县| 新蔡县| 泰宁县| 长海县| 轮台县| 眉山市| 许昌县| 辽源市| 霍州市| 资阳市| 宁陵县| 安义县| 海门市| 类乌齐县| 孝感市| 永泰县|