1. 지난 주간의 요약

[완료된 작업]

  • 프로젝트 제목 결정
  • 예비 연구 방향 설정

[진행 중인 작업]

  • 파이썬 초보자의 실수 데이터 수집

3. 이번 주간의 진행 상황

[완료된 작업]

피드백 프롬프트 초안 작성: 초기 계획은 데이터 수집 및 분석을 마친 후, 가능하다면 수집된 데이터를 활용하여 피드백 프롬프트의 초안을 작성하는 것이었습니다. 그러나, 데이터 수집에 앞서, 해결하고자 하는 문제의 유형에 대한 명확한 기준 설정이 필요함을 인식했습니다. 예를 들어, 코딩 테스트 문제를 해결하면서 발생한 에러와 학생이 제출한 코드를 분석할 것인지, 아니면 코딩 테스트 문제와 상관없이 코드 작성 중 발생한 에러만을 디버깅할 것인지 등의 결정이 필요했습니다. 이에 따라, Quanjun Zhang(문헌조사 9 참고)이 제안한 프롬프트 템플릿을 바탕으로, 피드백 프롬프트의 초안(표 1 참조)을 먼저 작성했습니다.

빈 문서 1001

표 1에서 라벨명의 의미는 다음과 같습니다.

  • 문제 유형: 발생한 에러의 유형을 나타냄
  • 버그 코드: GPT가 피드백을 제공하기 위해 필요한 기본 정보
  • 프롬프트 템플릿: 버그 코드를 기반으로 문제를 해결하기 위한 프롬프트 구조를 제시

파이썬 초보자의 실수 데이터 수집:1회차 프로젝트에서 회사의 파이썬 기초 프로그래밍 교육 과정을 바탕으로 주요 키워드를 선정하였습니다. 이 키워드들을 활용하여 공식 문서, 블로그, 기술 칼럼, 온라인 포럼 등에서 파이썬 초보자가 자주 마주치는 질문과 실수를 수집 중입니다. 모든 수집된 데이터는 데이터 프레임(그림 1 참조)에 체계적으로 저장하여 관리하고 있습니다. 데이터 프레임은 프롬프트 초안(표 1 참조)을 바탕으로 구성하였습니다.

image-20240627155133216


4. 다음 주간의 계획

  • 파이썬 초보자의 실수 데이터 수집: 선정된 키워드를 이용해 다양한 경로로부터 데이터를 계속해서 수집할 계획입니다. 또한, 회사에서 관리하는 온라인 저지 사이트에 접근하여 문제, 학생이 제출한 코드, 그리고 테스트 케이스 정보를 추출할 예정입니다.
  • LLaMA 연구: GPT 파인튜닝에 활용할 충분한 데이터 수집을 위해, LLaMA를 사용할 예정. LLaMA 관련 논문, 공식 가이드, 환경 셋팅이나 유튜브 강의 등을 참고하여 직접 사용해볼 예정.
  • 다음 단계에 대한 예비 연구 방향 설정: 다가오는 3회차 프로젝트 보고서 제출 전까지 가능한 많은 데이터를 수집할 예정입니다. 이후, 수집된 데이터를 바탕으로 코드 피드백 모듈에 대한 프롬프트 설계를 진행할지, 아니면 데이터 수집을 계속하면서 데이터 프레임 등을 개선할지 결정할 계획입니다.

댓글남기기