기본 콘텐츠로 건너뛰기

Python Matplotlib Scatter(산점도)

from sklearn.datasets import make_classification

예제
x, y = make_classification(n_samples=100, n_features=5, n_informative=2, random_state=7) # x는 지표, y는 정답, random_state : 랜덤 씨앗
x.shape # (100, 5)

import matplotlib.pyplot as plt
plt.scatter(x[:,0], x[:,1], s=2, c='r') # x의 0열, x의 1열, 크기는 2, 색은 빨강
plt.show()














예제
import pandas as pd
df = pd.read_csv('Salary_Data.csv')
df
'''
   YearsExperience Salary
0  1.1             39343.0
1  1.3             46205.0
2  1.5             37731.0
3  2.0             43525.0
4  2.2             39891.0
5  2.9             56642.0
6  3.0             60150.0
7  3.2             54445.0
8  3.2             64445.0
9  3.7             57189.0
10 3.9             63218.0
11 4.0             55794.0
12 4.0             56957.0
13 4.1             57081.0
14 4.5             61111.0
15 4.9             67938.0
16 5.1             66029.0
17 5.3             83088.0
18 5.9             81363.0
19 6.0             93940.0
20 6.8             91738.0
21 7.1             98273.0
22 7.9             101302.0
23 8.2             113812.0
24 8.7             109431.0
25 9.0             105582.0
26 9.5             116969.0
27 9.6             112635.0
28 10.3            122391.0
29 10.5            121872.0
'''

plt.plot(df.iloc[:,0], df.iloc[:,1])
plt.xlabel('YearsExperience')
plt.ylabel('Salary')
plt.title('Salary Data')
plt.show()














예제
df = pd.read_csv('sample_classification.csv')
plt.scatter(df['x'],df['y'], c=df['label'])
plt.title('sample_classification')
plt.xlabel('X 좌표')
plt.ylabel('Y 좌표')
plt.show()














이 블로그의 인기 게시물

Blogger

코드 하이라이트 사이트 http://hilite.me/ 코드 <!-- 나만의 공간 --> <style id='daru_css' type='text/css'> .code {      overflow: auto;      height: 200px;      background-color: rgb(239,239,239);      border-radius: 10px;      padding: 5px 10px; } .code::-webkit-scrollbar-thumb {      background-color: grey;      border: 1px solid transparent;      border-radius: 10px;      background-clip: padding-box;   } .code::-webkit-scrollbar {      width: 15px; } </style> <!-- 나만의 공간 -->

Python Sklearn make_blobs

from sklearn.datasets import make_blobs 예제 X, y = make_blobs(n_samples=500, centers=3, n_features=2, random_state=0) # 500개의 점을 3개로 모이게 한다, 변수는 2개, 무작위 상태는 0 X.shape, y.shape # ((500, 2), (500,)) plt.scatter(X[:,0],X[:,1],c=y,s=5) plt.show() # 학습 데이터 나누기 from sklearn.model_selection import train_test_split x_train, x_test, y_train, y_test = train_test_split(X, y, test_size=.25, random_state=0) x_train.shape, x_test.shape, y_train.shape, y_test.shape # ((375, 2), (125, 2), (375,), (125,)) # 지도 학습 하기 from sklearn.linear_model import LogisticRegression logisticReg = LogisticRegression(max_iter=5000) # 기본 반복 100 logisticReg.fit(x_train, y_train) # 추정하기 pred = logisticReg.predict(X) # 결정계수 logisticReg.score(x_test, y_test) # 0.92 # 한글 깨짐 없이 나오게 설정 from matplotlib import rcParams # 인코딩 폰트 설정 rcParams['font.family'] = 'New Gulim' rcParams['font.size'] = 10 # 산점도 plt.figure(figsize=(10,4)) plt.subplot(1,2, 1) plt.scatter(X[:,0],X[:,1],c=y) plt.title('정답') plt.su...

Python 문법

제곱 c = c**2; 주석 # 주석 함수 # 함수 형식 def hello(): # 함수 선언     print("여기는 함수") # 함수 실행문 hello() # 함수 호출 #결과: 여기는 함수 def add(a,b): # 매개변수에 자료형이 필요없다     c = a+b     print(f"{a} + {b} = {c}") add(3,5) #결과 : 3 + 5 = 8 if문 if a > b:     print("a가 큽니다") 객체의 정보 dir(객체) 객체의 주소 id(객체) 생략 if 'a' == 'a':     pass # 생략 else:     pass # 생략 enumerate for i,v in enumerate(range(20, 26)):     print(i,v) display display(df)