결과는 대실패였다.
스스로에게 자신감이 없었고, 내가 뭘 알긴 아나 확신이 없어도 억지로라도 프로젝트 형태의 작업을 체험하게 해주는 것이 수업과제 효용이라면, 이 번 인공지능 수업 과제도 그런 면에서는 내게 충분한 도움을 주었다.
뭔가 알겠지만 뭔지 잘 모르겠는 복잡하고도 애매한 상황에서 과제는 주어졌고, 머리를 쥐어뜯으며 만들어낸 아이디어는 스스로도 자신감이 없었지만, 어쨌든 평가는 평가.. 올림픽정신이든 뭐든 발휘하여, 완주하는 것 외에 내게 다른 선택지는 없었다.
주제는 거창하다.
자동차 외관 디자인으로 예측하는 연간 판매량
더 자세히 설명하자면, '인공지능을 통해 만든, 자동차 외관 디자인 기반 연간 판매량 예측모델' 정도 될까?
물론 인공지능을 잘 알거나, 자동차산업을 조금만 아는 사람들은 누구나 저게 될 리가 없다는 것을 잘 알 것이다. 교수님 반응도 그래서, 주제를 미리 의논하지 그랬느냐는 코멘트와 함께, 차라리 디자인보다는 웹상의 리뷰(텍스트)를 통해서 조언을 해주셨다.
하지만, 스스로 정한 방향으로 가고픈 욕심도 있었고, 이런저런 사정에 너무 치이고 있었던 당시에 방향 전환을 할 여유도 없었다. 그냥 끝까지 가보자.. 하는 마음으로 자료 양을 늘리고, 세팅도 보완하고, 데이터 전처리도 해보고... 이리저리 모색을 해봤지만, 모두 실패였다.
결국 의미가 없는 'Google Teachable Machine'으로 만든 예측모델 링크만 하나 남았지만, 그래도 이 인공지능 플랫폼의 사용법을 잘 알게 되었고, 안되는 것, 되는 것에 대한 구분 기준이 명확히 보이기 시작했다. 그리고 무엇보다도 다른 사람들의 발표를 보면서, 기발한 주제와 꼼꼼한 준비를 통한 가능성 있는 예측모델과 여러 이유로 실패로 끝난 사례의 교훈을 볼 수 있었던 게 큰 소득이었다.
자동차 외관 디자인은 훌륭한 사이트를 통해 운 좋게 해결
이 사이트를 통해서, 자동차 외관 사진을 모을 수 있었다. 물론 그 과정에서 일일이 클릭해서 다운받은 수작업을 활용하다 보니 많은 시간이 걸렸다.
여러 모델을 배우고, 다뤄보았지만, 구글 티처블 머신을 사용했다. 이미지/사운드를 구분하거나 이를 기반으로 판단하는 형태의 예측에는 적합하기도 하고, 무엇보다도 인터페이스나 사용방법이 매우 직관적이고 쉽다. 어린이들도 쉽게 쓸 수 있을 정도로 쉽고, 무엇보다도 무료인 데다가, 처리속도도 굉장히 빠르다.
미국에서 인기 있는 차종이기도 하고, 한국인으로서 그래도 차종에 대한 이해도 필요하다고 봤기에 픽업트럭보다는 SUV를 선택했다. 2023년 판매량 정보는 2022년에 비해 아직 완전하지 않은 듯 보여서, 가장 많은 차종별 판매량이 정리되어 있는 2022년을 택했다. 총 139개 차종별 판매량 정보를 수집할 수 있었고, 이를 평균 이상 판매, 미만 판매로 구분하여 정리했다. 그중 연 판매량 1,000대 미만 차종은 제외했고, 테스트용 자료를 빼놓는 과정에서 숫자를 조절해서, 학습데이터량을 그룹별로 동일하도록 맞췄다.
구글 티처블 머신에서는 '에포크', '배치 크기', '학습률' 등을 설정하여, 학습을 조절할 수 있습니다. 이리저리 조정해봤지만, 큰 도움은 되지 않았다. 애초에 한 그룹 당 61개 이미지로 자료가 많지는 않았기에 예정된 결과였을 수 있고, 대기업이 엄청난 노력을 기울여 개발하는 차량 디자인을 쉽게 인공지능으로 예측하기는 어려웠을 것이다. 게다가 자동차는 브랜드별 가치나 안전문제 등도 모두 중요한 변수가 되는 산업분야이니 더욱 변수가 많다.
결과는 끝내 실패
예측율은 55%로 정말 정확하게 실패였다. 스스로도 웃음이 나오는 결과였고, 시간낭비처럼 느껴지기도 했지만, 어떻게든 예측율을 높여보고자 스스로 고민해서 전처리 방식을 개선했던 것에 대해서는 뭔가 깨달았다는 희열은 있었다.
몇 가지 메모
1. 다른 사람들의 소중한 아이디어이기에, 여기에 남기긴 어렵지만, 상당히 높은 예측율을 보여준 성공적인 구글 티처블 기반 예측모델들도 있었다.
2. 2022,2023년 모두 미국에서 가장 잘 팔린 SUV는 'Toyota RAV4'였다. 일본자동차의 힘을 보여줄 수 있는 수치
3. 구글 티처블 머신에서 그룹을 나눠 학습을 시킬 때는, 그룹별로 입력되는 자료의 양(개수)가 같지 않으면 정확도를 보장할 수 없다.
4. 아이돌 등 한류 스타 얼굴 등 이미지를 식별하고자 하는 수강생의 도전은 많았다는 교수님의 코멘트... 요즘 한류가 대단하긴 한 가보다.
'생각 과잉 - 단순한 기록' 카테고리의 다른 글
이제는 친구 같은 라일리 - 인사이드 아웃 2(2024, 켈시 만 감독) (44) | 2024.07.07 |
---|---|
독서38 - 어나더 경제사 1(2023, 홍기빈) (45) | 2024.07.05 |
ChatGPT의 그림 솜씨 - 새로운 WADITO 로고 제작 (61) | 2024.06.26 |
아시아에서의 적응주의는 예수회 선교방식의 발전 결과인가? - 역사 속의 예수회 (6) (12) | 2024.06.14 |
별로 기대되지 않던 제작비 200억원 대작 - 비공식작전(2023, 김성훈 감독) (33) | 2024.06.10 |