안녕하세요, 샬롯의 투자 일지입니다.
일주일 동안 보고, 들었던 콘텐츠 중에서 인상 깊었던 내용을 요약하여 공유드려요! 😉
자세한 내용은 원문을 참고해 주세요!
AI가 스스로 만들어내는 합성데이터의 비밀
유튜브: 티타임즈TV
1. AI 성능의 필수 요소 데이터
- 초거대 AI, 구글 람다. 질 좋은 데이터가 필요한 이유는 여기서도 데이터가 다 라벨링이 되어 있어야 하기 때문.
- 다양한 데이터를 편향되지 않게 잘 수집하는 것이 중요.
2. 합성 데이터가 필요한 이유
- 초거대 AI라고 하더라도 데이터 수집과 모델링 필요.
- 합성데이터를 통해서 편향되지 않게 모델링도 가능. 따라서 적은 데이터로 충분한 결과 낼 수 있음.
3. AI가 편향된 결과물을 내놓지 않으려면
- MS 인공지능 테이, 편향되어 있었음. 모아진 데이터가 안 좋으면 편향된 결과를 낼 수밖에 없음.
4. 사진, 영상 합성데이터를 만드는 방법
- 사진 여러 장으로 영상 합성 데이터 만들 수 있음. 데이터세트로 만들어서 판매도 가능. 예를 들면, 나이 든 사진을 추측하는 AI를 모델링 할 수도 있음.
5. AI 개발하는 회사는 데이터를 어떻게 모으나
- 플랫폼 외의 회사들은 데이터 잘 모을 수 없음.
- 오픈 데이터 셋을 활용할 수 있음. 표준화된 데이터세트를 가지고 모델링 가능.
- 성능은 라벨이 되어 있는 데이터가 좋아서 이런 데이터를 수집하는 업체도 있음.
6. 합성데이터를 만드는 글로벌 기업
- 해외에서는 AI리버리, 인스타카트 등 회사.
- AI리버리는 산불 데이터로 예측.
- 케이퍼AI를 인수한 인스타카트는 3D스캐너 같은 기능. 360도로 돌려볼 수 있는 사진 또는 영상 보여주는 것.
7. 합성데이터의 분야별 장단점
- 합성데이터는 AI가 만든 모든 데이터를 뜻함.
- 2D 데이터는 기존 AI 모델의 성능이 좋지만, 초반 데이터 필요.
- 3D 데이터는 기존 AI 모델의 성능 좋게 만들 수는 없음. 대신 초반에 데이터 없이 바로 구현 가능.
8. 합성데이터는 누가 만드나?
- 합성데이터도 AI가 만든다.
-> 의견: 투자 아이디어로 활용하면 좋을 것 같습니다.
'투자 일상 기록' 카테고리의 다른 글
스탠포드 박사가 생각하는 테슬라의 미래 - 이효석 (0) | 2022.08.12 |
---|---|
틱톡이 유튜브 제쳤다고? 대세는 틱톡(TikTok) - 월가워즈 (0) | 2022.08.11 |
이제는 AI가 인간의 감정을 읽는가? 인공지능의 발전 어디까지 가능할까? - 김지윤의 지식Play (0) | 2022.08.09 |
야놀자의 나스닥행, 가능할까? 이재용 회계사 - 언더스탠딩 (0) | 2022.08.08 |
내가 틀릴 수도 있습니다 - 비욘 나티코 린데블라드 (0) | 2022.08.07 |