
도구(Tool)로 업그레이드되는 LLM
generated from playgroundai.com with prompt "robot picking which tool to use from many" 인간이 도구(Tool)를 사용하는 것을 배우고 나서부터 생태계의 강자가 되었듯이, LLM 역시 도구 사용(Tool Use)을 통해 강해질 수 있을까요? 지난 글에서 LLM이 직접 의사 결정을 내리고 어떠한 액션을 취할 수 있는
generated from playgroundai.com with prompt "robot picking which tool to use from many" 인간이 도구(Tool)를 사용하는 것을 배우고 나서부터 생태계의 강자가 되었듯이, LLM 역시 도구 사용(Tool Use)을 통해 강해질 수 있을까요? 지난 글에서 LLM이 직접 의사 결정을 내리고 어떠한 액션을 취할 수 있는
LLM 엔지니어링에 대한 단상 - 2
LLM 엔지니어링에 대한 단상 - 1
올해도 Google I/O 리뷰로 돌아왔습니다. 1년이라는 시간 참 빨리 가는데, 기술은 훨씬 더 빠르게 발전하는 느낌.. 저만 그런 것일까요? 2021, 2022년에는 “NLP 중심 리뷰”라고 했는데, 올해는 제목에 굳이 넣지 않았습니다. 올해는 정말 거의 모든 곳에 NLP, 특히 거대 언어 모델 (LLM), 생성형 AI (Gen AI)가 등장했습니다! 누구나
generated from playgroundai.com - "a celtic bard going around citing poems and songs colorful" 테크 회사들의 LLM 전쟁이 점입가경으로 치닫고 있습니다. 하루하루 새로운 연구와 발표가 쏟아지는 요즘, 그래도 가장 큰 거인들의 대결이 주목 받습니다. Open AI가 ChatGPT, GPT-4로 대중들의 관심과 유저 가입을 이끌며 큰 성공을 거두고 있고,
ChatGPT가 나온지 얼마도 되지 않아 GPT-4가 발표되었습니다. OpenAI가 움직이는 속도는 참 경이롭습니다. 마이크로소프트 인프라의 날개를 달아 그런지 더욱 빠르게 움직이는 것이 아닐까 싶습니다. 요즘 NLP를 공부하시는 분들은 하루하루 정신이 없으시죠? 그럴수록 정보의 홍수 속에 허우적되는 것보다, 핵심 정보만 선별해서 소화하는 것이 중요하다고 생각합니다. 특히 이럴 때일수록 공식 블로그나 논문을 원문으로
“retroanime style, two monsters fighting like their dancing. colorful” Playgroundai.com에서 이미지 생성 ChatGPT의 어떤 부분이 사람들을 이렇게 놀라게 하는걸까? 사람들은 왜 그렇게 흥분할까? 제가 지난 두 달 동안 대답하려고 노력했던 질문들입니다. 오랫동안 NLP를 연구하고 연구하는 사람으로서, 저는 ChatGPT를 그저 더 큰 모델 규모, 훈련 데이터를 통해 더 나은 응답
“a large monster with ropes tied to it in every direction. ropes are pulled to tame the monster. Artistic” Playgroundai.com에서 이미지 생성 ChatGPT라는 괴물이 세상에 던져졌습니다. 요즘은 정말 많은 사람들이 ChatGPT에 대해 이야기하고, 걱정하고, 공부하고 있습니다 (덕분에 블로그의 조회수가 폭발하고 있습니다!). 이 모델의 원리, 한계에 대해서 읽어보신 분들은 다음
ChatGPT에게 “ChatGPT의 한계에 대해 쓰는 블로그 글 인트로 써줘”라고 했더니 이러한 답이 나왔습니다. ChatGPT는 OpenAI에서 훈련한 대용량 언어 모델입니다. 이 모델은 자연어 생성, 질의 응답, 문장 요약 등 다양한 작업에 사용될 수 있습니다. 하지만, 이 모델에는 한계가 있습니다. 예를 들어, 이 모델은 과거의 지식을 기반으로 행동하기 때문에 최신 정보를
ChatGPT launched on wednesday. today it crossed 1 million users! — Sam Altman (@sama) December 5, 2022 ChatGPT가 공개된지 5일 만에 백만 유저가 가입했다고 합니다. 2020년 GPT3가 공개 되었을때 이상으로 화제를 불러일으키고 있습니다. 여태까지 공개된 언어 모델은 사람이 쓰는 글과 비슷하여 대단하다고 느꼈던 반면, 이번 버전은 인간 이상의 작문 능력과 창의력을
여러 언어를 다루는 NLP 모델을 학습시키기 전에 이러한 질문을 해봅니다: * 여러 개의 언어를 이해한다는 것은 어떤 것일까? 저는 다양한 국가에서 생활을 하기 위해서는 여러 외국어 단어를 배워야 했습니다. "사과" 같은 물리적인 물체라든가, 과거, 현재, 미래 같은 시간적 추상적인 개념, 또는 좋다, 싫다 같은 감정도 표현해야 하는 경우가 많았습니다.
새로운 언어를 배운다는 것은 또다른 하나의 세상을 여는 것과 같습니다. 하지만 언어 공부가 쉽지만은 않습니다. 영어만 공부해도 많은 시간이 들죠. 세상의 모든 이야기와 정보가 한국어로만 되어 있으면 얼마나 좋을까요. 하지만 옆 나라 일본에만 와도 말이 잘 통하지 않고 메뉴판의 문자를 읽을 수가 없습니다. 아시아, 유럽, 아프리카, 남미 등, 전세계에는 약