전체 글

SOOHO 개발공부노트
해당 포스팅은 네이버 부스트캠프 P-stage를 위해 개인 학습 내용을 정리했습니다. 1. 목표 FCN8s.py 만들어보기 mAP에 대해 이해하기 2. 진행 내용 1) FCN8s.py 만들어보기 FCN8s는 Backbone으로 VGG16을 사용하면서, FC layer 대신 Convolution layer로 바꿔줘서 위치의 정보를 잃지 않도록 만들어주는 방법입니다. 특히, semantic segmentation의 경우, 위치 정보를 보존하는 것이 중요합니다. FCN32s, FCN16s, FCN8s 등 여러 가지 종류가 존재하지만, 가장 성능이 좋은 FCN8s를 만들어 봤습니다. github를 참고하면서 fc6에서 kernel size가 7인 conv layer를 넣었습니다. 이외에도 크기를 맞춰주기 위해서..
해당 포스팅은 네이버 부스트캠프 P-stage를 위해 개인 학습 내용을 정리했습니다. 1. 목표 R-bert 모델의 fc layer 다양하게 적용해보기 다양한 모델 앙상블 2. 진행 내용 1) R-bert 모델의 fc layer 다양하게 적용해보기 fc layer input 형태 정확도 [cls, entity1, entity2] 78.2 [cls, entity1, entity2, entity1*entity2] 76.5 [cls, entity1, entity2, |entity1-entity2|] 78.1 [cls*entity1, cls*entity2] 76.2 [cls*entity1, cls*entity2, entity1*entity2] 76.2 최초의 R-bert에서 제안한 방법이 가장 성능이 좋았습니다..
· 생각
이 글은 글또 5기를 진행한 내용들을 바탕으로 글또 활동과 저에 대한 회고를 담았습니다. "시간은 흐른다. 분명 시간은 누구에게나 공평하게 흐른다. 하지만 그와 나의 시간은 그 농도가 너무나도 달랐다." 이 내용은 "이태원 클라쓰"의 최승권이 박새로이를 보며 생각하는 대사 중 일부입니다. 저에게 지난 6개월은 이전의 농도와는 확실히 다르다고 말할 수 있었던 시간이었습니다. 그 이유로는 두 가지를 말할 수 있습니다. 하나는 이 글을 적게 한 글또, 또 다른 하나는 인공지능을 깊이 있게 공부할 수 있도록 도와준 부스트캠프입니다. 오늘은 글또에서 했던 활동들을 회고해보려고 합니다. 1. 다짐 글 vs 현실 처음에는 "글또를 시작할 수 있을까?"라는 고민을 했었습니다. 아직 취업을 준비하고 있고, 그렇다고 글을..
해당 포스팅은 네이버 부스트캠프 P-stage를 위해 개인 학습 내용을 정리했습니다. 1. 목표 새로운 모델 적용 R-bert 2. 진행 내용 1) 새로운 모델 적용 R-bert R-bert는 논문 내용에 따르면, 관계 추출 Task에서 좋은 성능을 보여주고 있다고 합니다. entity 앞 뒤에 special token을 만들어주고, 각 entity에 대한 벡터를 average해서 cls에서 나온 것과 concatenate를 하는 방식을 사용하고 있습니다. R-bert를 이용했을 때, 이전에 baseline에서 돌리는 것보다 약 4%정도 acc가 증가하는 것을 확인할 수 있었습니다. R-bert의 구조가 두 entity에 대한 내용을 강조해주기 때문인 것 같습니다. 추가적으로, 위의 언급한 3개만 con..
해당 포스팅은 네이버 부스트캠프 P-stage를 위해 개인 학습 내용을 정리했습니다. 1. 목표 데이터를 추가하기 위한 전처리 작업 2. 진행 내용 1) 데이터를 추가하기 위한 전처리 작업 생각보다 전처리할 요소들이 많이 존재했고, 우리가 사용할 라벨에 해당하는 데이터가 300개 중 57개밖에 없었습니다. 이를 활용해도 크게 좋은 효과가 나오지는 않을 것 같지만 일단 정제 해봤습니다. 3. 회고 다음 주에는 다양한 모델로 돌려보고, entity에 대한 토큰을 추가해보도록 할 예정입니다.
해당 포스팅은 네이버 부스트캠프 P-stage를 위해 개인 학습 내용을 정리했습니다. 1. 목표 데이터 augmentation 방법 wandb 적용하기 2. 진행 내용 1) 데이터 augmentation 방법 자연어 처리에서의 augmentation 방법에는 여러 가지가 존재하지만, 이번 주어진 데이터는 서로 관계가 있는 라벨들이 존재했습니다. 첫 번째 케이스는 entity1 : entity2 관계가 바뀌어도 라벨이 바뀌지 않는 경우가 존재했습니다. 약 700개 정도에 대해 추가해줬습니다. 이를 동일한 조건에서 테스트한 결과 살짝 성능 향상은 있었습니다. 두 번째 케이스는 entitiy1 : entity2 관계를 바꾸면 다른 라벨로 바뀌는 경우입니다. 이 경우에는 서로 바꿔서 데이터를 늘려줄 수 있다고 ..
해당 포스팅은 네이버 부스트캠프 P-stage를 위해 개인 학습 내용을 정리했습니다. Day 2는 과제하느라, 특별하게 다른 것을 진행한 것이 없었습니다. 그래서 Day3가 Day2가 되었습니다. 1. 목표 Hugging fcae 라이브러리 과제 - 챗봇만들기 2. 진행 내용 1) Hugging face 라이브러리 Hugging face 라이브러리는 자연어처리에서 활용되는 유명한 라이브러리입니다. Transformers라는 라이브러리를 통해, 다양한 모델을 불러올 수 있고, 자동으로 토큰화해주기도 합니다. 또한 pre-trained 모델도 지원해주고 있습니다. 만약, 자연어처리를 공부하신다면, 꼭 한번 보시는 것을 추천드립니다. 2) 챗봇 만들기 오늘 만들어 본 챗봇은 짝으로 이뤄진 QA 데이터를 활용해..
해당 포스팅은 네이버 부스트캠프 P-stage를 위해 개인 학습 내용을 정리했습니다. 1. 목표 오늘의 Further Question 살펴보기 Baseline 코드 1회 이상 제출해보기 데이터 살펴보기 2. 진행 내용 1) Further Question 임베딩 평가 방법 임베딩 평가 방법에는 유사도 검사와 유추 평가가 있습니다. 먼저, 유사도 검사는 대표적으로 wordsim353이 존재합니다. Wordsim353은 353개의 영어 단어쌍과 해당 단어쌍의 유사도/관련도를 소수의 영어화자가 평가한 점수의 평균으로 구성됩니다. 예를 들면, Tiger-cat은 7.35로 유사하다고 판단하고 있습니다. 이처럼 각 단어쌍에 해당하는 2가지 단어 벡터의 코사인 유사도의 분포와 이 유사도/관련도 점수의 분포가 얼마나 ..
해당 포스팅은 Mastering OpenCV 4 with Python 원서를 바탕으로 작성했습니다. 원서를 옮기는 과정에서 부자연스러운 부분이 있을 수 있습니다. 잘못 작성되거나 어색한 부분에 대해서 알려주시면 감사하겠습니다! 이번 포스팅에서는 이전 포스팅에 이어서 동영상에 관련한 내용을 포함하고 있습니다. 파일과 이미지를 다루기 위한 이론적 소개 이미지 불러오고 저장하기 카메라 프레임과 비디오 파일 불러오기 비디오 파일 저장하기 1. 카메라 프레임과 비디오 파일 불러오기 일부 프로젝트에서는 우리는 카메라 프레임을 캡쳐해야 합니다. OpenCV에서는 카메라로부터 캡쳐하기 위한 명령어인 cv2.VideoCapture가 존재합니다. VideoCapture는 이미지 시퀀스, 비디오 파일 및 카메라와 같이 다양..
해당 포스팅은 Mastering OpenCV 4 with Python 원서를 바탕으로 작성했습니다. 원서를 옮기는 과정에서 부자연스러운 부분이 있을 수 있습니다. 잘못 작성되거나 어색한 부분에 대해서 알려주시면 감사하겠습니다! 이번 포스팅에서는 다음의 내용들 중 2개의 내용을 포함하고 있습니다. 아래의 2개에 대해서는 추가적으로 작성하여 올리도록 하겠습니다. 파일과 이미지를 다루기 위한 이론적 소개 이미지 불러오고 저장하기 카메라 프레임과 비디오 파일 불러오기 비디오 파일 저장하기 1. 파일과 이미지를 다루기 위한 이론적 소개 컴퓨터 비전 프로젝트에서는 위의 그림처럼 다양한 종류의 입력 파일들을 다뤄야 합니다. 또한 processing을 진행한 뒤에 다양한 파일들을 결과를 얻을 수 있습니다. 그래서 이번..
Sooho_Kim
SOOHOCODE