해당 포스팅은 네이버 부스트캠프 AI Tech 학습 정리 자료임을 알려드립니다.
1. 강의를 듣고 느낀점
오늘 강의는 특강 내용으로 다뤄졌기 때문에 말씀해주신 부분보다는 저에 대한 적용 위주로 작성되었습니다. 글을 읽으실 때 참고해주시면 감사하겠습니다.
박성준 마스터님 - NLP를 위한 언어 모델의 학습, 평가
NLP 분야에서는 언어 모델을 평가하는 다양한 Task가 존재합니다. 대표적으로 GLUE가 있고, 이를 바탕으로 다양한 언어적 특성을 고려해서 FLUE, CLUE, KLUE 등으로 각 나라의 모델을 평가합니다. KLUE에는 다양한 Task가 존재하지만 각 테스크 별로 어떤 metric을 사용해야 하는 가에 대한 논쟁이 계속 이뤄지고 있습니다. 특히, 새로 만들어지는 Task에 대해서는 더더욱 그런 것 같습니다.
문지형 마스터님 - AI와 저작권법
이 강의는 처음에 이쪽분야에 대해 공부하면서 가장 먼저 궁금했던 이야기들이여서 더 열심히 들었습니다. 생각보다 웹에 있는 크롤링해서 가져오게 되면 문제가 많이 발생할 수 있습니다. 만약, 웹 크롤링할 때 반드시 저작권에 대한 내용을 확인하고 가져와야 합니다. 저작권 부분에서 문제가 생길 소지가 있다고 생각이 든다면, 저작권이 표기되어 있지 않아도 사용하지 않는 것을 권합니다. 그래서 기업들도 크롤링보다는 직접 업체를 통해 데이터를 만들고 라벨링하는 것 같다고 생각했습니다. 궁금했던 주제로 발표해주셔서 감사하다고 생각했고, 추후 회사에서 이 부분에 대해 신경쓰면서 일을 해야할 것 같습니다.