허깅페이스에는 AutoModelForCausalLM, AutoModelForMaskedLM, AutoModelForSeq2SeqLM 등의 다양한 모델 관련 Autmo 클래스가 있습니다. 각 클래스는 세부적인 method나 attribute가 다르고, LLM을 통해 풀려는 task의 종류에 따라 적절한 클래스를 사용해야 합니다. 이와 관련된 주요한 개념...
[LLM] max_length와 max_new_tokens 차이
(텍스트 생성을 위한) LLM 모델을 이용해 문장을 생성할 때, max_length나 max_new_tokens와 같은 값을 설정해야 하는 경우가 있습니다. 해당 파라미터들의 의미와 차이에 대해서 알아보겠습니다. 설명 저의 경우는 허깅페이스의 AutoModelForCausalLM과 AutoTokenizer로 불러온 모델과 토크나이저를 기반으로 pip...
[Error] ImportError: cannot import name 'packaging' from 'pkg_resources' when starting
TL;DR transformers 라이브러리 버전 올리는 작업 후 패키지를 import하는 부분에서 아래와 같은 에러가 발생할 수 있습니다. ImportError: cannot import name 'packaging' from 'pkg_resources' when starting 해결방법 저의 경우는 set...
[Review] 인과추론의 기준점: 무작위 실험
본 글은 Korea Summer Workshop on Causal Inference 2023의 내용을 주관적으로 정리한 글입니다. 추가적인 설명이 필요한 분들을 위해 원래 영상 링크를 같이 첨부합니다. 링크: [Week 2-3] 인과추론의 기준점: 무작위 실험 Week 2. Gold Standard of Causal Inference: Ra...
[Review] 잠재적결과 프레임워크의 가정
본 글은 Korea Summer Workshop on Causal Inference 2023의 내용을 주관적으로 정리한 글입니다. 추가적인 설명이 필요한 분들을 위해 원래 영상 링크를 같이 첨부합니다. 링크: [Week 2-2] 잠재적결과 프레임워크의 가정 Week 2. Randomized Controlled Trial SUTVA(; Sta...
[Review] 잠재적결과 프레임워크
본 글은 Korea Summer Workshop on Causal Inference 2023의 내용을 주관적으로 정리한 글입니다. 추가적인 설명이 필요한 분들을 위해 원래 영상 링크를 같이 첨부합니다. 링크: [Week 2-1] 잠재적결과 프레임워크 Week 2. Randomized Controlled Trial 무작위 실험 ...
[LLM] 데이터 불러오기 - load_dataset
허깅페이스의 datasets 라이브러리는 다양한 데이터셋을 쉽게 로드하고 사용할 수 있도록 돕는 매우 유용한 도구입니다. 이 라이브러리는 자연어 처리를 포함한 여러 머신 러닝 프로젝트에 필요한 데이터를 제공하며, 데이터를 탐색하고 이해하는 과정을 간소화합니다. 이번 포스트에서는 datasets.load_dataset 함수를 사용하여 데이터셋을 어떻게 ...
[Git] Local branch 삭제
Git을 사용해 코드작업을 하다보면, 불필요하거나 잘못 생성하는 브랜치가 생길 수 있습니다. 이런 경우 로컬 저장소에서 해당 브랜치를 삭제해야 합니다. Git에서 로컬 브랜치를 삭제하는 방법에 대해 알아보겠습니다. git branch git branch -d <로컬 브랜치 이름> git branch는 브랜치 목록 확인, 제거 등 생성...
[Git] 원격 저장소(remote repo) URL을 변경
개발 프로젝트를 진행하다 보면 원격 Git 저장소의 URL을 변경해야 하는 경우가 있습니다. 예를 들어 프로젝트 저장소를 다른 호스팅 서비스로 이전하거나, 저장소 이름을 변경하는 등의 상황이 있을 수 있습니다. URL이 변경되면 로컬 Git 설정에서도 이러한 변경을 반영해야 합니다. 커맨드라인 명령어로 URL을 변경하는 명령어를 알아보겠습니다. g...
24년 02월의 공부 - pypi 패키지 업로드
2024년 2월 동안 검색하고 공부한 것들을 정리한 내용입니다. pypi 패키지 업로드 참고자료 나만의 파이썬 패키지(PYPI) 만들기 및 등록하고 배포하기 (파이썬) 모듈 개발부터 배포까지 패키지 빌드 # pip install setuptools wheel python3 setup.py sdis...