본문 바로가기

일기24

2021-01-17 오늘도 일기는 짧게 끝내겠다! 오늘 특별히 한 일은 발급받은 GPT3 시크릿키로 Playground에서 GPT3를 조금 맛본 것이다. 다음 사진들은 AI와 내가 대화한 사진이다. 롤을 한다길래 롤하자고 했더니 씹혔다... 이거 말고 오늘 한 일은 굳이 말하자면 전구 달린 전선 벽에 붙이기..?? 일단 혼자 하긴 했는데 한이 오면 다시 예쁘게 해야겠다. 한이 오기 전에 집 정리도 하고 으.. 벌써 새벽 6시다. 아침에 랩실로 출근해야 하는데 큰일 난 것 같다. T.T 오늘 일기는 여기서 마무리하겠다. HTML 삽입 미리보기할 수 없는 소스 2021. 1. 18.
2021-01-16 그래도 오늘은 어제와 달리 한 일이 있어서 일기를 길게 쓸 수 있을 것 같다! 월요일 교수님과 GPT2 작사 관련 미팅을 위해 자료를 준비했다. 아직 코드를 제대로 모르긴 하지만... 일단 코드의 결과를 분석해보도록 하겠다. 우리는 작사를 위해 Github 의AITEXTGEN이라는 GPT2 인터페이스를 이용해 작곡했다. 우리가 입력한 데이터셋은 518KB의 동요 가사들이다. 대략 600-700 곡 정도의 동요 텍스트 파일이다. 먼저, AITEXTGEN 레포지토리 > Aitextgen 폴더 > aitextgen.py를 참고하면 각 파라미터에 넣어야 하는 값들을 알 수 있는데 집중해야 하는 파라미터는 Prompt와 Temperature이다. :param n: Numbers of texts to generat.. 2021. 1. 17.
2021-01-15 늦게 일어나서 천천히 집 정리도 하고 밥도 먹고 준비하고 집에 오니 밤이 되어있었다... 뭐라도 하려고 aitextgen 코드를 돌려봤지만 2-3시간은 걸릴 것 같아 오늘 결과를 보는 것은 포기하고, 기존 우리가 입력한 데이터셋과 학습을 통해 출력된 결과 문서의 유사도를 검사해보려 했으나 두 문서 모두 용량이 매우 커서 어떤 표절 검사기도 돌아가지 않았다. T.T 웹사이트에선 되는 곳이 아예 없는 것 같고 표절 검사 프로그램도 다운로드하여 돌려봤지만 데이터가 로드되는 시점에서 프로그램이 끊겨 버렸다. 깃허브에서 문서를 비교해 유사도를 검사해주는 코드를 찾아보려 했지만 딱히 나오는 게 없었다. 결과적으로 오늘도 아무것도 안 한 게 돼버렸다. 본가에선 할 수 있는 일이 한정적이긴 한데 월요일이 교수님과 다시.. 2021. 1. 16.
2021-01-14 현재 시간 오전 3시 42분... 오늘은 빠르게 좀만 쓰고 자야 할 것 같다. 오늘 한 것도 없어서 일기 쓰기도 뭐하지만 하루 빼먹기 시작하면 계속 빼먹을 것 같으니 쓰고 자야겠다. 2시 반에 교수님과 미팅이 있어서 준비하고 학교로 향했다. 추위 알레르기가 있어서 오늘도 두드러기가 일어날까 봐 걱정했는데 바지 안에 레깅스를 입어서 그런지 약을 먹어서 그런지 하나도 나지 않았다. 미팅 전에 GPT2에 대해 너무 아는 게 없어서 공부를 좀 하고 가려했는데 늑장 피우느라 결국 아무것도 공부하지 않고 갔다. 그래도 대화는 잘돼서 다행이었다! 교수님께선 기존 우리가 입력한 데이터셋과 aitextgen으로 작사된 결과물 두 개를 비교할 수 있는 표절 탐지기를 돌려보라고 추천해주셨다. 그리고 generate 함수의 .. 2021. 1. 15.
2021-01-13 어젠 일기 쓰고 일찍 자려했는데 동요 데이터셋을 수집하고 데이터를 전 처리하는 과정이 너무 오래 걸려서 늦게 자버렸다. 전 처리하는 과정에서 조사한 동요들을 보는데 순수하고 예쁜 가사가 정말 많았다. 생각나는 동요들을 틀어놓고 따라 부르면서 재밌게 전 처리한 것 같다. 결국 두시를 넘기고 자서 11시쯤에 일어났다. 저번에 요마트에서 시킨 반찬들을 다 먹어서 다시 치킨 너겟, 주스, 라면을 시켰다. 나가서 장을 봐야 하는데 귀찮아서 밖을 안나가게 되는 것 같다. 내일은 미팅 때문에 학교에 나가야 해서 끝나고 집에 들어오기 전에 장을 보든, 편의점을 들리든 먹을 것 좀 더 사 와야겠다. 요마트에서 작은 전구가 달린 전선 같은 걸 팔길래 그것도 시켜봤다. 건전지가 없어서 아직 사용은 못하지만.. 전구에 필요한.. 2021. 1. 14.
2021-01-12 일기를 쓰기 전 미리 말하자면 지금 매우 피곤하므로 글이 뒤죽박죽일 수도 있다.. 원랜디 보통 난이도 한판 했는데 기가 다 빨려버렸다. 재밌긴 한데 내 머리랑 안 맞는 느낌이다 : 2021. 1. 12.
2021-01-11 아침에 8시 반에 일어나서 공부했어야 했는데 어제 새벽 3시에 자버려서 거의 12시에 일어나버렸다.. 오늘 일찍 자야지 다짐하고 친구랑 얘기해서 공부 디코 서버를 모각스로 바꿨다! 새로운 친구도 들어왔는데 너무 신나서 공부해야 하는데 떠들어버렸다.. 모각스가 아니라 모같떠라고 바꿔야 하는 거 아니냐는 말도 나왔다. 떠드는 걸 마치고 오늘도 React 강의를 들었다. 너무 쌩기초같아서 빨리 들어야지 하고 듣고 있었는데 state 개념이 나오고 뭔가 막히는 느낌이 들었다. 이해가 가지 않는 건 아닌데 내가 들은 강의를 블로그에 옮기려니 어려웠다. 코드를 내가 직접 짜 보려고 해야 하는데 요즘에 계속 강의만 들으면서 따라 하는 코딩만 했더니 코딩 실력이 더 퇴화한 것 같다.. 스스로 해보려는 노력을 해야 할 .. 2021. 1. 11.
2021-01-10 10일 일기인데 11일에 쓰다니... 게임하느라 시간 가는 줄 몰라서 늦게 써버렸다. 오늘 10시에 인턴 공부라 일찍 자야 하는데 오랜만에 롤을 해서 너무 오래 해버렸다 :( 아침에 일어나서 에타를 보니 교내 게임 리그 운영진을 모집한다길래 지원했다. 저번 년도 게임 리그도 운영진으로 참여했었는데 재밌었어서 다시 한번 신청했다. 저번 리그를 참여하고 받은 빨대!! 한 번도 쓴 적은 없지만 고이 모셔두고 있긴 하다. 그리고 원래 장을 봐야하는데 날씨도 춥고 밖에 나가기도 귀찮아서 요마트에서 치킨너겟, 미니핫도그, 김치, 음료수, 김치 만두를 시켰다. 그런데 배달 오고 보니 핫도그가 에어프라이어용이었다.. 그냥 전자레인지에 돌려먹어도 맛있긴 한데 보관이 불편할 것 같다. 밥을 먹고 유튜브를 구경하다가 VS .. 2021. 1. 11.
2021-01-09 한 게 너무 없어서 일기를 써도 될까 고민일 정도로 특별한 사건도 열심히 한 일도 없는 날이다. 저번에 요마트로 시킨 장조림 메추리알을 아침으로 먹었는데 생각보다 맛있고 한 끼 반찬으로 먹기 딱 좋았다. GPT2에 관련해서는 결국 Bos, Eos 토큰은 해결하지 못한 채 NarrativeKoGPT2 가 아닌 다른 길을 찾게 되었다. https://github.com/minimaxir/aitextgen GitHub - minimaxir/aitextgen: A robust Python tool for text-based AI training and generation using GPT-2. A robust Python tool for text-based AI training and generation usi.. 2021. 1. 9.
2021-01-08 금요일은 원래 랩실에 가서 공부를 하는 날이지만, 요즘 날씨가 날씨인지라 랩실에 출근하지 못하고 집에서 디스코드로 친구와 화면 공유를 하며 공부를 했다. React 기초 강의를 듣고 있는데 너무 쌩 기초라 지금 이걸 하고 있는 게 맞는 건지 싶을 정도... 빨리 끝내고 심화 과정을 공부해야 할 것 같다. 그래도 이왕 듣는 거 열심히 듣다가 국밥이 배달 와서 맛있게 먹었다. 원래 국밥을 좋아하는 편이 아닌데 배가 고팠던 건지 맛있게 먹었다. React 강의를 듣다가 점점 질려서 아직 해결하지 못한 GPT2 코드를 살펴보았다. 문장이 출력되어야하는 공간에 , , 가 자꾸 들어가서 이를 해결하고자 NarrativeKoGPT2 폴더의 py 파일들을 전반적으로 수정해봤다. vocab_b_obj = gluonnlp.. 2021. 1. 8.
2021.01.07 일어나자마자 까르보불닭, 김이랑 밥을 먹고 두드러기 약을 먹었다. 오랜만에 아침형 인간처럼 일어나 밥을 먹고 뭔가 하려니까 기분이 좋았다. 밥을 먹은 후, 저번에 학습속도도 너무 느리고 제대로 된 학습 결과가 나오지 않는 http://NarrativeKoGPT2.ipynb의 epoch를 50으로 늘려 실행시켜봤다. 아침 8-9시부터 돌리기 시작했는데 오후 4시에 epoch가 49까지 늘어나더니 멈췄다. 그리고 학습 결과도 좋아지지 않았다... , 태그만 나올 뿐 직접 입력한 "우리" 빼고는 제대로 된 글자가 출력되지 않았다. 혜민님께서 , 태그의 출처를 찾아보셨을 때, 우리 코드에 "Bos", "Eos" 라는 토큰이 있는데 각각 start token, end token이라는 의미이고 코드에서 , 로 표현.. 2021. 1. 7.
2021.01.06 데이터베이스 연구실 방학 계획 - 생활코딩 리액트 기초 강의 듣기 - 인프런 John Ahn 리액트 챗봇 강의 듣기 - 인프런 John Ahn 리액트 쇼핑몰 사이트 강의 듣기 - 카카오 웹페이지(https://www.kakaocorp.com/) 클론코딩? 졸업 프로젝트 작사 알고리즘 수정 - KoGPT2-Lyrics-Generation-FineTuning(http://github.com/danbom/KoGPT2-Lyrics-Generation-FineTuning-Version1), NarrativeKoHPT2(https://github.com/danbom/narrativeKoGPT2)를 병합하기 위해 tensorboardx(fromfrom tensorboardX import SummaryWriter), .. 2021. 1. 6.