일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- DFS
- react #리액트 #동빈나
- 프로그래머스
- java #자바 #나동빈
- java #자바 #생활코딩
- 다익스트라
- react #리액트 #동빈나 #나동빈 #유튜브강의
- 파이썬 #백준 #알고리즘 #코딩테스트
- PYTHON
- 파이썬 #알고리즘 #코딩테스트 #프로그래머스
- Dijkstra
- 알고리즘
- 백준
- 파이썬
- dp
- css #생활코딩 #웹
- 다이나믹프로그래밍
- java #자바
- 재귀
- 백준 #파이썬 #알고리즘 #코딩테스트
- 백준 #알고리즘 #파이썬 #코딩테스트
- 코딩테스트
- java #자바 #동빈나
- 프로그래머스 #파이썬 #코딩테스트 #알고리즘
- css #웹 #생활코딩
- 투포인터
- 자바 #java
- BFS
- 프로그래머스 #파이썬 #알고리즘 #코딩테스트
- 백트랙킹
- Today
- Total
목록
728x90
프로젝트/KBO 외국인 투수 스카우팅 최적화 경진대회
728x90
(6)
커리까지
선수별로 SVM은 나중에 구해보고 원래대로 한국에서 경기수와 승률 상위 20%와 하위 20%의 스탯을 뽑아 승패를 학습하기 throw_df = pd.read_csv('률lus_win_lose_2.csv') top20 = throw_df.sort_values(['승률','경기수'], ascending=False).reset_index(drop=True)[:20] bottom20 = throw_df.sort_values(['승률','경기수'], ascending=False).reset_index(drop=True)[-20:] display(top20) display(bottom20) 단순히 승률로만 본다면 1경기 뛰고 이기면 100%여서..
svc가 무엇인지, 매게변수가 어떤의미를 가지는지 알아보기 출처 : https://bskyvision.com/163 SVC(kernel='rbf', gamma = gamma, C = C) svm은 데이터를 선형으로 분리하는 최적의 선형 결정 경계를 찾는 알고리즘 c는 이상치의 정도를 설정한다. c를 높일수록 이상치를 엄격하게 관리하는 것이고 c가 낮을수록 이상치의 허용에 관대하다. c가 너무 낮으면 과소적합, c가 너무 높으면 과대적합이 될 가능성이 커진다. 선형 svm으로 한계가 있어서 3차원으로 보고 경계를 짓는 rbf 커널 svm이 나왔다. 그래서 커널을 rbf로 지정해주었다. 감마가 클수록 작은 표준편차를 가진다. 데이터 포인터가 영향력을 행사하는 거리가 짧아진다.

그럼 구종이 다양하면서 단타 비율이 높고 키가 크면서 결정구를 가지고 커맨드가 좋은 선수를 뽑으면 되겠다. 그동안에 방출안된 선수들의 기록을 살펴보자. BABIP이 낮고, WAR이 높고, SwStr과 Swing이 높고 GB,FB,IFFB도 높은 순으로 찾아봐야겠다. 거기에 구종의 개수를 추가하자. 물론 세이브와 안타, 홈런, ERA도 고려해야 한다. kbo타자들이 어떤 공에 취약한지 찾아보고 그 공을 자주 던지는 선수를 찾아보자. 외국인스탯캐스터.groupby(['pitcher_name','pitch_name']).agg({'pitch_name':'count'}) 이렇게 그동안의 구종을 종합해보았다. 외국인스탯캐스터.groupby(['pit..

만들었던 csv 불러오기 외국인역대성적 = pd.read_csv('kbo_yearly_foreigners_2011_2018_추가분.csv',encoding='utf-8-sig',engine='python',sep=',') 외국인역대성적.head() 지난번에 승_패를 저장했던 파일을 다시 불러온다. 그러면 이렇게 정상적으로 불러와진다. 현재 승,패가 같이 붙어있으니 따로 나눠서 승,패로 새로운 컬럼으로 넣어주자. 외국인역대성적['승'] = 외국인역대성적['2011년_승_패'].apply(lambda x:str(x).split(' ')[0]) 외국인역대성적['패'] = 외국인역대성적['2..
eval() 2011~2018년도 딕셔너리를 만들어서 저장해야했다. 그러면 총 8개의 딕셔너리 변수가 선언되어야 한다. 하나씩 코딩하기에 불편하니 for문을 돌려서 딕셔너리를 만들었다. 123456789101112names=[]def setName(cnt): global names for i in range (11,cnt+1): names.append('name_dict_{}'.format(i)) for name1 in names: globals()[name1] = {} for i2 in name_list: globals()[name1][i2] = 0 print(name1) print(globals()[name1]) setName(18) Colored by Color Scriptercs 그러면 이렇게 f..

데이콘 - KBO 외국인 투수 스카우팅 최적화 경진대회 [연습] 데이터 불러오기 import pandas as pd 외국인역대성적 = pd.read_csv('kbo_yearly_foreigners_2011_2018.csv') 외국인메이저성적 = pd.read_csv('fangraphs_foreigners_2011_2018.csv') 외국인스탯캐스터 = pd.read_csv('baseball_savant_foreigners_2011_2018.csv') 신규외국인성적 = pd.read_csv('fangraphs_foreigners_2019.csv') 신규외국인스텟캐스터 = pd.read_csv('baseball_savant_foreigners_..