2022. 11. 13. 17:27ㆍ학부 강의/데이터마이닝
1. 연관규칙
대량의 데이터에서 빈번하게 발생하는 데이터의 패턴을 찾는 것.
맥주를 사는 사람은 마른안주도 함께 구매한다.
장바구니 분석이라고도 함.
- 지지도(support)
: 특정 아이템이 데이터에서 발생하는 빈도
: A와 B를 동시에 포함하는 거래수 / 전체 거래수 - 신뢰도(confidence)
: 두 아이템의 연관규칙이 유용한 규칙일 가능성의 척도 (높을수록 좋다)
: A와 B를 동시에 포함하는 거래수 / A를 포함하는 거래수 - 향상도(lift)
: 두 아이템의 연관규칙이 우연인지 아닌지를 나타내는 척도 (1을 기준으로 크거나 작아야 의미 있는 규칙이다)
: A와 B를 동시에 포함하는 거래수 / A포함거래수 * B포함거래수
출처 : https://welcome-to-dewy-world.tistory.com/61
가. 실습
install.packages("arules")
install.packages("arulesViz")
library(arules)
library(arulesViz)
- arules : Mining Association Rules and Frequent Itemsets (연결 규칙 및 빈도 마이닝)
- arulesViz: Visualizing Association Rules and Frequent Itemsets (연결 규칙 및 빈도 시각화)
sports <- read.csv("sport.csv", header = TRUE, sep =",")
str(sports)
head(sports)
sports_ar <- sports[,-1]
sports_ar <- sports[,-1]
: 1번 열을 제외한 나머지 열들을 가로로 나열.
sports_ar$baseball <- as.factor(sports_ar$baseball)
sports_ar$basketball <- as.factor(sports_ar$basketball)
sports_ar$soccer <- as.factor(sports_ar$soccer)
sports$soccer
sports_ar$soccer
baseball, basketball 그리고 soccer에 들어있는 0과 1을 숫자가 아닌 factor로 인식하도록 한다.
read.csv(…., stringsAsFactors = true)
옵션을 사용하지 않은 것은 string 타입이 아니기 때문이다.
사용하면 이상하게 동작한다. 주의할 것.
rules <- apriori(sports_ar)
rules
inspect(rules)
rules ← apriori(sports_ar)
: 데이터셋이 큰 경우 효율적으로 연관규칙을 생성하기 위해 apriori 알고리즘을 사용한다.inspect(rules)
: 생성된 규칙들을 확인합니다.
출처 : https://carrot-woo.tistory.com/57
2. AI 이미지
최근에 AI가 그린 그림이 미술대회에서 대상을 수상한 일이 있었다.
또 작가들이 자신의 작품이 AI의 학습 데이터로 활용되는 것에 반대하고 나선 일도 있었다.
AI 기술이 발전함에 따라서 산업이 변화하고 있다는 것을 체감한 첫 번째 사건이다.
이번 수업시간에는 이와 관련된 신기술들을 탐방해 보았다.
가. deepai
원하는 장면을 텍스트로 묘사하면 이를 이미지로 생성해주는 사이트다.
링크 : https://deepai.org/machine-learning-model/text2img
나. autodraw
그림을 대충 그리면 알아서 완성시켜주는 사이트다.
링크 : https://www.autodraw.com/
다. portraital
사진을 넣으면 중세의 초상화풍으로 바꿔준다.
누구세요?
라. whichfaceisreal
진짜 사람과 AI가 만든 사람을 구별해보는 사이트다.
링크 : https://www.whichfaceisreal.com/
마. petalica.com
어… 음…
씹덕이 아니라
그림 채색을 도와주는 사이트다.
링크 : https://petalica.com/index_en.html
'학부 강의 > 데이터마이닝' 카테고리의 다른 글
2022-11-26 데이터마이닝_9 (0) | 2022.11.26 |
---|---|
2022-11-13 데이터마이닝_8 (0) | 2022.11.13 |
2022-10-14 데이터마이닝_6 (0) | 2022.10.14 |
2022-10-06 데이터마이닝_5 (0) | 2022.10.06 |
2022-09-28 데이터마이닝_4 (0) | 2022.09.28 |