오렌지 데이터마이닝(4)
-
2022-12-06 데이터마이닝_12
기말고사로 밀린 포스팅 ^^ 1. 감정 추측 글의 분위기를 추측한다. pos : 긍정적 neg : 부정적 neu : 중립적 compound : 전체적인 태도 (1을 넘어야 긍정적 태도로 확신) 영어만 가능하다. imagine dragons의 노래 3곡의 분위기를 측정해보았다. 2. Wikipedia 사용 Orange에서 제공하는 Wikipedia 기능을 사용하면 위키에 있는 검색결과를 바로 코퍼스로 가져올 수 있다. 위키피디아에 teemo 검색. ^오^
2022.12.18 -
2022-11-29 데이터마이닝_11
기말고사 준비로 밀린 포스팅 ^^ 1. 문자열 분석 word cloud를 클릭해서 보면 아래와 같은 결과를 볼 수 있다. preprocess를 한 것과 안 한 것의 차이다. in, the, to, of와 같은 불필요한 것들을 제거한다. (이 외에도 preprocess의 역할은 더 다양하다.) 2. 실습_워드클라우드 자기가 스스호 선정한 주제로 직접 위드 클라우드 그려보기. 출처 : https://ftw.usatoday.com/lists/league-of-legends-patch-notes-preseason-2023 롤 프리시즌 패치노트에 관한 기사 중 일부를 이용해서 워드 클라우드를 그려보았다. 실제로 이번 패치에 관해서 디렉터가 언급한 중요 포인트는 ‘정글 포지션’이었다. 3. 실습_텍스트 비지도 학습..
2022.12.18 -
2022-11-26 데이터마이닝_10
1. 비지도 학습 비지도 학습으로 k-Means와 Hierarchical Clustering을 사용해 봤다. 가. k-Means fixed: 5 : 이미지를 5가지로 분류 나. Hierachical Clustering 이미지를 분류할 경우에는 Ward를 선택한다고 한다. 2. 실습_비지도 학습 2~3개의 사물을 주제로 합쳐서 20개 사진을 다운로드한다. 이를 분류하도록 비지도 학습을 진행한다. 이미지 다운로드 : 구글 fixed: 2 : 이미지를 2가지 분류 맥주와 소주 이미지를 가지고서 한번 분류하도록 시켜보았다. 오… 생각보다 똑똑한데? 고든 램지도 극찬한 CASS 빼고는 맥주랑 소주로 나눴다. 3. 실습_지도 학습 학습 데이터로 사용된 이미지의 개수와 종류(클래스)의 이름과 수 설명한다. 지도 학습..
2022.11.27 -
2022-11-26 데이터마이닝_9
1. Test & Score CA : Classification accuracy is the proportion of correctly classified examples. Precision : Precision is the proportion of true positives among instances classified as positive, e.g. the proportion of Iris virginica correctly identified as Iris virginica. Recall : Recall is the proportion of true positives among all positive instances in the data, e.g. the number of sick among a..
2022.11.26