前言(可略):
最近觀察了 部落格的人氣
發現1400多個拜訪紀錄中 有1000個都是置頂的

 CUDA 安裝失敗顯示 "Visual Studio Integration" Failed

而且其中佔大多數的流量都是來自google 
我猜 大家都是遇到了安裝問題 然後靠關鍵字搜尋進來的
然後只點了置頂文 對於我的其他文章... 就沒有興趣
這讓我懷疑 我寫的其它文 到底有沒有意義@@

雖然自己講說就把這些當作~~閱讀網路上其他教學的筆記
但心底還是希望會有人來看阿!!!!
總之 我會先試試把置頂的取消 看其他文章會不會有人點...
然後再想想更吸引人的關鍵字吧XD
好啦 前言有點長 進正題吧
 


正文:
今天新手小白要介紹的是我們怎麼操作 Pandas 裡的 DataFrame
首先 當然先匯入 Pandas 和  (這上回有教了)
import Pandas as pd
import numpy as np
#接著我們試試 隨機生成一個矩陣
#你可以用下列的方式來生成 還有其他的函數也可以 請看後記
qq= np.random.randn(5,3)  # 5*3的矩陣

#這是新手小白跑出來的結果 因為是隨機生成的 所以每次的值會不一樣
#但可以看出來是5列 3行的矩陣
#要變成DataFrame呢? 很簡單
qqq= pd.DataFrame(qq)
#基本上這跟R 裡邊的as.dataframe 是一樣的

#還是要提醒 py 裡邊的 index 是從0 開始的

#接著 如果要有欄位名稱的話 請跟我這樣做!!
qqq= pd.DataFrame(qq, columns=list("ABC"))
qqq

# 馬上就有欄位A B C 了 是不是挺酷炫的
# 不過 你會發現 在叫資料的時候 我都直接打我的 DataFrame 也就是qqq
# 但一般如果資料太長的話(比如說100行) 這樣一次顯示出來會很痛苦
# 所以我們可以試試 head()函數
qqq.head(3)

 

#我在括號中打 3 就是顯示前三筆  不打的話 也就是 qqq.head() 
#它預設是前5筆
#此外 還有其他叫資料的方法
#例如 我要叫第A欄出來
qqq['A']

#還蠻直觀的方法  
# 注意一下 你會看到 後面有寫 dtype 這東東 就是在講欄位A的資料格式
# float64 是浮點數64位的意思   ##這邊就不細講囉 反正是有小數的意思就對 知道一下 

#或用矩陣的叫法 例如:
qqq[0:3]

#它就會叫出 0,1,2 這三行 
#跟R 不一樣的是 R是叫出 0,1,2,3 四行 所以這點要習慣
 

#然後要叫多列的話 可以用

qqq[['A','B']]

## 好啦~ 這就是 DataFrame 的基本操作
## 不過 DataFrame 可以操作的東西還有很多 以後有機會在介紹囉
## 感謝大家^^


附錄:
1. 如果是要改 現有的DataFrame 的欄位名稱 或 index 可以這樣寫:

2. 隨機矩陣的生成有很多 這邊舉一些 其他的可以在網路上查

    numpy.random.randn() #常態分配 N(0,1)
    numpy.random.rand() #均勻分配   [0,1]
    numpy.random.random_sample(size=None) #[0,1) 
    numpy.random.random_integers(low,high=None,size=None)  #要整數的話可以用這個
    numpy.random.choice()  #這個好玩了 是可以抽樣的函數
    

    
3. 另外 可以用  np.random.seed(12345) 括號裡面打一個固定的數字
    這樣每次生成的隨機變數都會是一樣的

 

 

 

 

 

 


 

 

arrow
arrow
    文章標籤
    新手 小白 入門 python
    全站熱搜
    創作者介紹
    創作者 Markjong001 的頭像
    Markjong001

    新手小白用Python來做資料分析是否搞錯了什麼

    Markjong001 發表在 痞客邦 留言(0) 人氣()