Python是當(dāng)今世界*熱門的編程語(yǔ)言,而它*的應(yīng)用領(lǐng)域就是使用 Pandas 數(shù)據(jù)分析,使用 Pandas 我們可以 Excel/CSV/TXT/MySQL 等數(shù)據(jù)讀取,然后進(jìn)行各種清洗、過(guò)濾、透視、聚合分析,也可以直接繪制折線圖、餅圖等數(shù)據(jù)分析圖表,在功能上它能夠?qū)崿F(xiàn)自動(dòng)化的對(duì)大文件處理,能夠?qū)崿F(xiàn)Excel的幾乎所有功能并且更加強(qiáng)大。
對(duì)數(shù)學(xué)專業(yè)的人來(lái)說(shuō),Pandas可以作為一個(gè)*的數(shù)據(jù)分析切入點(diǎn)。下面融躍小編為大家介紹12種用于數(shù)據(jù)分析的Pandas技巧。
1. Boolean Indexing
在表格中,如果你想根據(jù)另一列的條件篩選當(dāng)前列的值,你會(huì)怎么做?舉個(gè)例子,假設(shè)我們想要一份所有未畢業(yè)但已經(jīng)辦理了貸款的女性清單,具體的操作是什么?在這種情況下,Boolean Indexing,也就是布爾索引能提供相應(yīng)的功能。
2. Apply Function
Apply函數(shù)是使用數(shù)據(jù)和創(chuàng)建新變量的常用函數(shù)之一。在對(duì)DataFrame的特定行/列應(yīng)用一些函數(shù)后,它會(huì)返回相應(yīng)的值。這些函數(shù)既可以是默認(rèn)的,也可以是用戶自定義的。
3. 替換缺失值
對(duì)于替換缺失值,fillna可以一步到位,它會(huì)用目標(biāo)列的平均值/眾數(shù)/中位數(shù)更新缺失值。
4. Pivot Table
Pandas可以用來(lái)創(chuàng)建MS Excel樣式數(shù)據(jù)透視表(Pivot Table)。
5. Multi-Indexing
如果你仔細(xì)觀察了“替換缺失值”那一節(jié)的輸出,你可能會(huì)發(fā)現(xiàn)一個(gè)奇怪的現(xiàn)象,就是每個(gè)索引都由3個(gè)值組合而成。這被稱為多重索引(Multi-Indexing),它有助于操作的快速執(zhí)行。
注:
多索引需要元組來(lái)定義loc語(yǔ)句中的索引組。這是一個(gè)在函數(shù)中要用到的元組。
values [0]的后綴是必需的,因?yàn)槟J(rèn)情況下返回的值與DataFrame的值不匹配。在這種情況下,直接分配會(huì)出現(xiàn)錯(cuò)誤。
6. Crosstab
這個(gè)函數(shù)可以被用來(lái)塑造對(duì)數(shù)據(jù)的初始“感覺(jué)(概覽)”,通俗地講,就是我們可以驗(yàn)證一些基本假設(shè)。如在貸款案例中,“Credit_History”是否會(huì)影響個(gè)人貸款成功?這可以用交叉表(Crosstab)測(cè)試,
7. 合并DataFrame
當(dāng)我們需要將來(lái)自不同來(lái)源的信息進(jìn)行整合時(shí),合并DataFrame(或者你們愛(ài)說(shuō)數(shù)據(jù)框)就變得很重要了。
8. DataFrame排序
Pandas可以輕松基于多列進(jìn)行排序。
9. 繪圖(Boxplot和直方圖)
很多人可能不知道自己能直接在Pandas里繪制盒形圖和直方圖,無(wú)需單獨(dú)調(diào)用matplotlib,一行命令就能搞定。
10. Cut function for binning
有時(shí)候聚類后的數(shù)據(jù)會(huì)更有意義。以今天*近車禍頻發(fā)的自動(dòng)駕駛汽車為例,如果我們要用它捕獲的數(shù)據(jù)重現(xiàn)某條路上的交通情況,比起一整天的流暢數(shù)據(jù),或是把一天均勻分割為24個(gè)小時(shí),“早上”“下午”“晚上”“夜晚”“深夜”這幾個(gè)關(guān)鍵時(shí)段的數(shù)據(jù)包含的信息量更多,也更有效。
11. 為nominal數(shù)據(jù)編碼
有時(shí)候我們需要對(duì)稱名數(shù)據(jù)(nominal數(shù)據(jù))重新分類,這可能是由于各種原因造成的:一些算法(如Logistic回歸)要求所有輸入都是數(shù)字,所以我們要把稱名變量重新編碼為0,1 ...(n-1)。
有時(shí)一個(gè)類別可能包含多種表達(dá),如“溫度”可以被記錄為“High”“Medium”“Low”“H”“l(fā)ow”,其中“High”和“H”是一碼事,“Low”和“l(fā)ow”也是一碼事,但Python會(huì)認(rèn)為它們是不同的。有些類別的頻數(shù)*低,所以我們應(yīng)該把它們合并起來(lái)。
為了解決這個(gè)問(wèn)題,這里我們定義了一個(gè)簡(jiǎn)單的函數(shù),它把輸入作為“字典”,然后調(diào)用Pandas的replace函數(shù)重新編碼。
12. 迭代dataframe的行
這不是一個(gè)常用的技巧,但如果遇到這種問(wèn)題,相信沒(méi)人想到時(shí)候再絞盡腦汁想辦法,或者直接自暴自棄用for循環(huán)遍歷所有行。這里我們舉兩個(gè)要用到這種方法的場(chǎng)景:當(dāng)帶有數(shù)字的nominal variable被當(dāng)成數(shù)字。當(dāng)某一行帶有字符(因?yàn)閿?shù)據(jù)錯(cuò)誤)的Numeric variable被當(dāng)成分類。這時(shí)我們就要手動(dòng)定義列的類別。雖然很麻煩,但這之后如果我們?cè)贆z查數(shù)據(jù)類別。
數(shù)據(jù)分析是一個(gè)很熱門*有價(jià)值的職場(chǎng)技能,學(xué)會(huì)了 Pandas 會(huì)*大的助力你的職業(yè)生涯。
閱讀排行
- 1 frm考試指定計(jì)算器是哪個(gè)?
- 2 CFA持證人,再戰(zhàn)FRM金融風(fēng)險(xiǎn)管理師
- 3 2025年FRM考試的報(bào)名流程和時(shí)間安排
- 4 一名在校生的真實(shí)FRM學(xué)習(xí)經(jīng)驗(yàn)分享,3千字干貨!
- 5 成為FRM持證人需要工作經(jīng)驗(yàn)嗎?
- 6 2025年frm二級(jí)考試和報(bào)名時(shí)間安排
- 7 2025年frm一級(jí)考試和報(bào)名時(shí)間安排
- 8 考frm要不要報(bào)課程學(xué)習(xí)?
- 9 金融專業(yè)如何快速備考FRM一級(jí)考試
- 10 考frm大幾開(kāi)始學(xué)比較好?多久能考完?
- 報(bào)考條件
- 報(bào)名時(shí)間
- 報(bào)名費(fèi)用
- 考試科目
- 考試時(shí)間
-
GARP對(duì)于FRM報(bào)考條件的規(guī)定:
What qualifications do I need to register for the FRM Program?
There are no educational or professional prerequisites needed toregister.
翻譯為:報(bào)名FRM考試沒(méi)有任何學(xué)歷或?qū)I(yè)的先決條件。
可以理解為,報(bào)名FRM考試沒(méi)有任何的學(xué)歷和專業(yè)的要求,只要是你想考,都可以報(bào)名的。查看完整內(nèi)容 -
2024年5月FRM考試報(bào)名時(shí)間為:
早鳥價(jià)報(bào)名階段:2023年12月1日-2024年1月31日。
標(biāo)準(zhǔn)價(jià)報(bào)名階段:2024年2月1日-2024年3月31日。2024年8月FRM考試報(bào)名時(shí)間為:
早鳥價(jià)報(bào)名階段:2024年3月1日-2024年4月30日。
標(biāo)準(zhǔn)價(jià)報(bào)名階段:2024年5月1日-2024年6月30日。2024年11月FRM考試報(bào)名時(shí)間為:
早鳥價(jià)報(bào)名時(shí)間:2024年5月1日-2024年7月31日。
標(biāo)準(zhǔn)價(jià)報(bào)名時(shí)間:2024年8月1日-2024年9月30日。查看完整內(nèi)容 -
2023年GARP協(xié)會(huì)對(duì)FRM的各級(jí)考試報(bào)名的費(fèi)用作出了修改:將原先早報(bào)階段考試費(fèi)從$550上漲至$600,標(biāo)準(zhǔn)階段考試費(fèi)從$750上漲至$800。費(fèi)用分為:
注冊(cè)費(fèi):$ 400 USD;
考試費(fèi):$ 600 USD(第一階段)or $ 800 USD(第二階段);
場(chǎng)地費(fèi):$ 40 USD(大陸考生每次參加FRM考試都需繳納場(chǎng)地費(fèi));
數(shù)據(jù)費(fèi):$ 10 USD(只收取一次);
首次注冊(cè)的考生費(fèi)用為(注冊(cè)費(fèi) + 考試費(fèi) + 場(chǎng)地費(fèi) + 數(shù)據(jù)費(fèi))= $1050 or $1250 USD。
非首次注冊(cè)的考生費(fèi)用為(考試費(fèi) + 場(chǎng)地費(fèi)) = $640 or $840 USD。查看完整內(nèi)容 -
FRM考試共兩級(jí),F(xiàn)RM一級(jí)四門科目,F(xiàn)RM二級(jí)六門科目;具體科目及占比如下:
FRM一級(jí)(共四門科目)
1、Foundations of Risk Management風(fēng)險(xiǎn)管理基礎(chǔ)(大約占20%)
2、Quantitative Analysis數(shù)量分析(大約占20%)
3、Valuation and Risk Models估值與風(fēng)險(xiǎn)建模(大約占30%)
4、Financial Markets and Products金融市場(chǎng)與金融產(chǎn)品(大約占30%)
FRM二級(jí)(共六門科目)
1、Market Risk Measurement and Management市場(chǎng)風(fēng)險(xiǎn)管理與測(cè)量(大約占20%)
2、Credit Risk Measurement and Management信用風(fēng)險(xiǎn)管理與測(cè)量(大約占20%)
3、Operational and Integrated Risk Management操作及綜合風(fēng)險(xiǎn)管理(大約占20%)
4、Liquidity and Treasury Risk Measurement and Management 流動(dòng)性風(fēng)險(xiǎn)管理(大約占15%)
5、Risk Management and Investment Management投資風(fēng)險(xiǎn)管理(大約占15%)
6、Current Issues in Financial Markets金融市場(chǎng)前沿話題(大約占10%)查看完整內(nèi)容 -
2024年FRM考試時(shí)間安排如下:
FRM一級(jí)考試:
2024年5月4日-5月17日;
2024年8月3日(周六)上午;
2024年11月2日-11月15日。FRM二級(jí)考試:
2024年5月18日-5月24日;
2024年8月3月(周六)下午;
2024年11月16日-11月22日。查看完整內(nèi)容
-
中文名
金融風(fēng)險(xiǎn)管理師
-
持證人數(shù)
25000(中國(guó))
-
外文名
FRM(Financial Risk Manager)
-
考試等級(jí)
FRM考試共分為兩級(jí)考試
-
考試時(shí)間
5月、8月、11月
-
報(bào)名時(shí)間
5月考試(12月1日-3月31日)
8月考試(3月1日-6月30日)
11月考試(5月1日-9月30日)