본문 바로가기

전체 글31

컴퓨터비전 주요 논문 리스트업 컴퓨터비전 분야에서의 주요 논문을 한번에 정리하기 위한 공간입니다.목차1이미지 분류(Image Classification)2비디오 분류(Video Classification)3RNN based Models4트랜스포머(Transformers)5객체 탐지(Obejet Detection)6세그멘테이션(Segmentation)7메트릭 러닝(Metric Learning)8멀티모달 학습(Multimodal Learning)9생성 모델(Generative Models) 📌 1. 이미지 분류 (Image Classification)논문 제목모델/키워드링크ImageNet Classification with Deep Convolutional Neural NetworksAlexNetpaperVisualizing and U.. 2025. 5. 2.
[논문 리뷰] Transformers without Normalization https://arxiv.org/pdf/2503.10622요약Transformer 모델에서 Normalization Layer를 안 쓴 경우를 보신적 있나요?최근 Normalization Layer는 Neural Networks에서 가장 기존적인 요소로 자리매김했으며,특히 Transformer 모델에서는 압도적으로 많이 사용되고 있습니다오늘 살펴본 논문을 Normalization Layer를 대체 가능한 Dynamic Tanh에 대해 살펴보고자 합니다. Introduction- Normalization Layer 사용 필수일까?[현재 상황]2015년 Batch Normalization이 제안되고 나서부터 현재까지 Normalization Layer는 사실상 모든 네트워크에서 사용되고 있습니다. 이는 최적.. 2025. 4. 15.
컴퓨터 비전에는 어떤 Task가 있을까? 인공지능 분야인공지능 분야 안에도 머신러닝, 딥러닝뿐만 아니라자연어처리, 음성인식, 로보틱스, 컴퓨터 비전 등 다양한 분야가 있습니다. 머신러닝과 딥러닝은 이미 아실 것이라는 가정 하에 다른 분야들을 매우 간결하게 이해하자면,자연어처리는 말 그대로 자연어(텍스트)를 처리하는 Task들을 수행하는 기법이고,컴퓨터 비전은 Vision이라는 말대로, 시각적으로 보이는 것을 다루는 영역입니다.요즘은 멀티모달이라고, 다양한 데이터셋을 합쳐서 Task를 수행하기도 합니다.예를 들면, 이미지를 주고 텍스트로 이미지에 대해 요약해달라고도 하고, 텍스트로 이미지를 생성해달라고도 하면 해줍니다. 저희에게 밀접하게 느껴지는 ChatGPT가 그런 역할을 요즘 해주고 있죠. 멀티모달은 현재 핫한 연구 분야입니다.하지만, 본 포.. 2025. 3. 21.
[논문 리뷰] MLVU: Benchmarking Multi-task Long Video Understanding [2406.04264] MLVU: Benchmarking Multi-task Long Video Understanding MLVU: Benchmarking Multi-task Long Video UnderstandingThe evaluation of Long Video Understanding (LVU) performance poses an important but challenging research problem. Despite previous efforts, the existing video understanding benchmarks are severely constrained by several issues, especially the insufficientarxiv.org 요약Multi Mod.. 2025. 3. 18.
[논문 리뷰] Meta의 Neural Prophet, NeuralProphet: Explainable Forecasting at Scale [2111.15397] NeuralProphet: Explainable Forecasting at Scale  NeuralProphet: Explainable Forecasting at ScaleWe introduce NeuralProphet, a successor to Facebook Prophet, which set an industry standard for explainable, scalable, and user-friendly forecasting frameworks. With the proliferation of time series data, explainable forecasting remains a challenging taskarxiv.org 오늘 다룰 논문은 Meta에서 공개한 Ner.. 2025. 3. 12.
[논문리뷰]AR-Net: A simple Auto-Regressive Neural Network for time-series(2019) [1911.12436] AR-Net: A simple Auto-Regressive Neural Network for time-series AR-Net: A simple Auto-Regressive Neural Network for time-seriesIn this paper we present a new framework for time-series modeling that combines the best of traditional statistical models and neural networks. We focus on time-series with long-range dependencies, needed for monitoring fine granularity data (e.g. minutes,ar.. 2025. 3. 3.