분류 전체보기(549)
-
2023-01-04 AI입문_11
1. NLP (자연어 처리) 자연어란 사람이 사용하는 언어를 지칭한다. 자연어 처리(NLP)는 컴퓨터를 이용해서 자연어를 이해, 생성하기 위한 분야다. 가. NLP 기술 보기에도 많은 기술이 사용된다. 나. 머신러닝과 NLP 머신러닝을 이용해서 NLP하는 전체 과정을 간략하게 표현한 것. NLP를 위한 머신러닝 모델의 입력으로 사용할 대부분의 특징은 형태소 분석기와 같은 도구(software)를 통해서 제작한다. 2. 코퍼스 (Corpus) 머신러닝 모델을 학습시키기 위해서 실제 언어가 사용된 사례가 필요하다. 이에 분석에 활용할 텍스트 모음을 코퍼스라고 한다. 코퍼스의 예시로 한국어 위키피디어를 활용한 코퍼스, Naver 영화 리뷰를 활용한 코퍼스, IMDB 영화 리뷰를 활용한 코퍼스 등이 있다. 가...
2023.01.04 -
2023-01-02 AI입문_10
1. RNN 가. 순차 데이터 (data sequence) 데이터 간 상호 순서상 연관성을 갖는 경우. 시계열 데이터 : 주가 변동, 환율 변동, 모션 시계열 신호 또는 이미지 : 음성신호, 동영상 프레임 구두 연설, 문서 텍스트 나. RNN의 기능 순차 데이터 처리의 종류 예측 : 주가 예측, 문장에서 다음 단어 예측, 동영상에서 다음 프레임 예측 등 분류/판단 : 문장 요약, 문법오류판단 등 생성 : 번역, 캡션생성(장면 묘사) 등 위와 같은 처리를 위해서는 과거의 상태(과거의 입력)를 기억할 필요가 있음. 다. RNN의 구조 RNN은 이전 상태를 저장할 수 있는 기능을 가진다. 위와 같이 표현하는 방법을 ‘시간 펼침 (Unrolling in time)’이라고 한다. RNN 분석 및 학습을 편리하게 ..
2023.01.02 -
2022-12-25 소프트웨어공학_13
메리 솔로크리스마스 1. 디자인 패턴 사람들은 일정을 관리하거나, 할 일을 정리하고, 가계부를 작성하는 등 각자의 용도에 맞게 노션을 사용한다. 여기서 주목해야 할 것은 사람마다 노션을 사용하는 용도가 완벽하게 일치하진 않지만 비슷한 용도로 노션을 사용하는 경우가 더러 있다는 것이다. 이에 노션에서는 이용자들이 흔히 필요로 하는 페이지들로 하여금 빠르게 구현할 수 있게 템플릿을 제공한다. 노션뿐만 아니라 소프트웨어를 개발하는 과정에서도 비슷한 설계를 빠르게 구현할 수 있게 템플릿을 제공한다. 소프트웨어를 구현하는 것에 있어서 자주 사용하게 되는 설계 형태를 정형화하여 하나의 설계 템플릿으로 만든 것을 디자인 패턴이라고 한다. 2. GoF 디자인 패턴 Gang of four의 약자로 교수님이 왜 GoF인지..
2022.12.25 -
2022-12-24 소프트웨어공학_12
0. 형상 형상이란 소프트웨어 개발 과정의 산출물(소스코드, 문서 등)이 배치된 모습을 뜻한다. 1. 형상 관리 (configuration management) 형상관리는 … 형상 항목을 식별하여 그 기능적 물리적 특성을 문서화하고, 그러한 특성에 변경을 제어하고, 변경에 관하여 기록 및 보고하고, 명시된 요구사항에 부합하는지 확인하는 기술적이고 관리적인 감독, 감시 활동이다. 프로젝트의 생명주기 동안 제품의 무결성과 변경에 대한 추적성을 확보하는 것이 목적이다. 가. 필요성 프로젝트를 진행하면 요구사항의 변동이 있는 경우가 많다. 이때 형상 관리를 수행하지 않는다면 요구사항 변동에 따른 산출물의 수정 결과가 관련자들에게 제대로 전달되지 않는다. 관련자들의 작업내용이 중복될 수도 있고, 중심이 되는 소스..
2022.12.24 -
2022-12-23 소프트웨어공학_11
1. 검증과 확인 프로세스 시험에 자주 나오는 Software V&V다. 가. 검증 (Verification) 소프트웨어가 요구사항 문서에 부합하여 구현되었음을 보장하는 활동. 요구사항 명세서에 기술된 대로 제품을 만들어지고 있는지 확인 한다. 개발자의 관점에서 제대로 만든 소프트웨어인지 확인. 나. 확인 (Validation) 소프트웨어가 고객의 의도에 따라 구현되었음을 보장하는 활동 쓸만한 제품을 만들고 있는 확인한다. 고객의 입장에서 제대로 된 제품을 만들고 있는지 확인. 2. 검증과 확인 기법 가. 정적 방법 (Static) 소프트웨어를 실행하지 않고 결함을 찾아내는 것 대표적 방법 : 검토(review), 검수(inspection), 워크스루(walk-through) 여러 참여자가 모여 소프트웨..
2022.12.23 -
2022-12-23 소프트웨어공학_10
0. UML 설계 1. 4+1 View 모델 시스템 개발에 참여하는 이해관계자들의 역할에 따른 관점을 제시한다. 가. 논리 관점 유스케이스 다이어그램과 요구사항 기술서에 기술된 기능들을 프로그래밍 시각으로 변경하는 관점 객체를 추출하고, 객체들의 세부적인 속성과 동작에 대해 정의 클래스/상태/오브젝트/시퀀스/커뮤니케이션 다이어그램 등 사용 나. 프로세스 관점 Integrator가 작업을 통합하기 위해 사용한다. 시스템 개발 전반의 작업 수행 주체와 작업의 흐름 정의에 중점 상태, 시퀀스, 액티비티, 컴포넌트 다이어그램 등 사용 다. 개발 관점 개발자들의 관점으로 시스템 개발 방법에 대해 정의 계층구조, 제약사항, 코드 재사용 등 시스템 구현을 위한 요건 정의 컴포넌트 다이어그램(논리적 단위로 정의), 패..
2022.12.23 -
2022-12-06 데이터마이닝_12
기말고사로 밀린 포스팅 ^^ 1. 감정 추측 글의 분위기를 추측한다. pos : 긍정적 neg : 부정적 neu : 중립적 compound : 전체적인 태도 (1을 넘어야 긍정적 태도로 확신) 영어만 가능하다. imagine dragons의 노래 3곡의 분위기를 측정해보았다. 2. Wikipedia 사용 Orange에서 제공하는 Wikipedia 기능을 사용하면 위키에 있는 검색결과를 바로 코퍼스로 가져올 수 있다. 위키피디아에 teemo 검색. ^오^
2022.12.18 -
2022-11-29 데이터마이닝_11
기말고사 준비로 밀린 포스팅 ^^ 1. 문자열 분석 word cloud를 클릭해서 보면 아래와 같은 결과를 볼 수 있다. preprocess를 한 것과 안 한 것의 차이다. in, the, to, of와 같은 불필요한 것들을 제거한다. (이 외에도 preprocess의 역할은 더 다양하다.) 2. 실습_워드클라우드 자기가 스스호 선정한 주제로 직접 위드 클라우드 그려보기. 출처 : https://ftw.usatoday.com/lists/league-of-legends-patch-notes-preseason-2023 롤 프리시즌 패치노트에 관한 기사 중 일부를 이용해서 워드 클라우드를 그려보았다. 실제로 이번 패치에 관해서 디렉터가 언급한 중요 포인트는 ‘정글 포지션’이었다. 3. 실습_텍스트 비지도 학습..
2022.12.18