안녕하세요, 모모에요.
요즘 글 정리에 조금 소홀한 감이 없지 않아 있어요.
뭐 그렇지만 간간히 하나씩은 쓸게요.
오늘은 vision ai의 트렌드에 대해 개인적인 생각을 적어볼까해요
거대하게 or 매우 작게
제목 그대로를 따라가는 게 보여지는 트렌드라고 생각됩니다. LLM, VLM 이를 넘어서는 거대 시스템을 구축하거나, on device 에 AI 기능을 탑재하는 것이 트렌드라고 보여집니다. 생각해보면 간단합니다. AI로 돈 벌 수 있는게 무엇이 있을까를 생각해보면 됩니다. 떠오르는 게 없죠? 저도 없어요. 쉽지가 않거든요. AI를 상용화 한다는 건, 정말 쉽지 않은 일이에요. 많은 사람들은 말하죠. classification? detection? 그거 쉬운거 아니야? 그런데 반대로 생각해 볼까요?? 그렇게 쉬운데 왜 상용화 된 제품이 없는거죠?? 왜 일상에서 찾아보기 힘든 걸까요?? 그렇게 쉬운 기술이면 왜 자율 주행에 아직까지도 적용되지 않았을까요??
쉽지 않아서 입니다. 이상하죠? 뭐가 쉽지 않냐. 사람들의 눈 높이가 굉장히 높고 엄격하기 떄문입니다. 학자들이 말하는 눈 높이와, 실제 사용자가 원하는 레벨은 상이합니다. 더 까다롭고 까탈스럽죠. 그런데 생각해보면 당연한게 아닐까요?? 내가 돈 주고 사는 데, 오류가 나온다? 쓰겠어요?? 근데 오류가 없게 만든다?? AI를 해보신 분들이라면 말이 되는 소리를 해야지 라는 생각을 하실꺼에요. 여튼 현실이 이렇기 때문에 AI로 돈을 벌기가 쉽지가 않다는 겁니다.
위에서 잠깐 언급드렸지만, 까탈스럽다, 까다롭다, 이를 해결하려면 더 좋은 성능의 AI 모델을 탑재한 시스템이 나와야한다는 수많은 결론 중 하나의 결론도 나올 수 있을 겁니다. '좋은 성능' 을 좀 더 풀어서 생각해 보면, 일반적인 상황에서 일반적인 문제들을 풀 수 있는 것도 하나의 좋은 성능이라고 말할 수 있지만 특수한 상황에서 특수한 상황을 정말 잘 인식하는 것 역시 좋은 성능이라고 평가하게 되겠죠. 전자가 대규모 모델이 활용되는 방향성이며, 후자가 on device ai 에서 찾고 있는 길이라는 겁니다.
대규모 모델을 만들고 학습시킨다는 것은 웬만한 기업의 인프라로는 힘듭니다. 정말 돈을 쏟아 부을 생각, 그 돈을 회수 못해도 상관 없다는 생각이 아니면 투자하기 힘든 사업입니다. 솔직히 말하면, 그런 기업이 몇 개나 있을까 싶습니다. 그럼 현실적으로 많은 기업이 참여할 수 있는 시장은 후자입니다. 특수한 상황에서 특수한 기능을 수행하는 모델을 만드는 것. 특수한 상황을 가정기에, NPU 를 만드는 기업과 해당 NPU에서 지원하는 모델을 만드는 소프트웨어 기업이 합쳐지면 후자에 대한 모델을 만들 수 있는 것이죠. 후자의 경우는 어떤 사용 예시가 있을까요? 스케일을 좀 크게 보자면, AI 기능이 탑재된 핸드폰, 노트북 등이 있겠고, 작은 스케일로 가자면 현재 나와있는 키오스크에 AI 기능을 탑재해 볼 수 있겠죠. 물론 이것도 작은 사업은 아니지만, 앞서 말씀드린 대규모 모델에 비하면 한 없이 작은 스케일이긴 합니다.
그럼 트렌드는 저렇다고 치면 어떤 분야가 주목 받게 될까요?? 우선은 모델은 설계하는 분야가 기본적으로 존재할 겁니다. 모델을 작게 or 크게 설계를 해야할 테니까요. 그 다음은 해당 모델을 모델 설계 부분에서 최적화 하는 분야가 주목 받겠지요. 모델의 추론 성능 중 평가 지표를 높게 가져가야 할 테니까요. 조금만 더 구체적으로 들어가면, loss fuction을 설계하거나, 학습 속도를 빠르게할 network를 설계한다거나 하는 일들이 앞서 언급드린 모델 설계에서의 최적화와 관련된 분야일 거에요. 이 외에는 어떤 분야가 있을까요?? 모델을 양자화 시키거나, 가지치기를 한다거나 하는 모델 크기에 대해 최적화 하는 분야 역시 주목 받을 수 밖에 없습니다. 성능을 유지한 체 모델을 작게 가져갈 수 있다는 것은 하드웨어와 관련해 생각해보면 비용 절감과 연관되니까요. 그 다음은 없을까요? 조금 더 들어가 모델을 추론하기 위한 실행 환경도 주목 받습니다. 추론 환경에서 모델을 최적화해서 돌린다는 것은 모델 설계에서의 최적화와는 또 다른 이야기거든요. 즉 어떤 하드웨어에서 하드웨어의 성능을 최대로 뽑을 수 있도록 만들어지는 가에 대한 문제이기 때문에 해당 부분 역시 주목받을 겁니다. 너무 많은 거 아니야? 라고 물을 수 있겠지만, 이보다 더 많은 분야가 있겠지요.
요약
- 모델 설계 트렌드 : 매우 거대하게 or 매우 작게
- 매우 크게 예시 : gpt, sora 등
- 매우 작게 예시 : npu를 탑재한 노트북 등
- 모델 최적화 : 양자화 ( int4, FP 를 넘어 그 이상 , 하드웨어가 지원해 주는 범위 까지 )
- 실행 타임 : 하드웨어를 포함하는 시스템에서 실행 속도의 최적화 ( tensorrt와 onnxruntime과 같은 역할을 하는 sdk )
'AI' 카테고리의 다른 글
CSPNet 파헤치기 1 (2) | 2023.04.19 |
---|---|
[torch] 기본 함수 이해와 활용 (0) | 2023.01.19 |
coco 2017 pose track image and open pose keypoint (0) | 2022.10.18 |
st-gcn 코드 분석 1 (2) | 2022.10.04 |
Transformer 동작 원리 이해하기 (0) | 2022.07.05 |