Extraction of Narrative Structure from TV Series - Laboratoire Interdisciplinaire des Sciences du Numérique Accéder directement au contenu
Thèse Année : 2021

Extraction of Narrative Structure from TV Series

Extraction de la structure narrative de séries TV

Résumé

In the current explosions of multimedia content, there is a need to reorganize a large collection of multimedia documents. Narratives and their structure can help in this regard, particularly, in narratively long and continuous multimedia collections, such as TV series. Current TV series are composed of complex structures involving several intertwined narratives within the same episode and this continues until the last episode of the TV series. In this thesis, we focus on extracting and understanding narrative structure of TV series considering the fusion of multimodal features and narrative elements. Narratives in TV series come in small narrative units, scenes. Hence, working on scene level is the best way to extract and understand the overall narratives. In this thesis, we have proposed a novel way of extracting and understanding narrative structure via scenes linking. To do that, we have investigated scene segmentation which is based on features extracted from neural network models that take into account the visual and textual modalities of TV series. Then, a new way of scene-linking via fuzzy clustering is investigated, at different levels of granularity. The fuzzy clustering takes into consideration the narrative elements of scenes to create the links between them. Inter and intra episode links are created to capture the progression of a narrative throughout the TV series. Next, the most reportable scenes (MRS) are detected, to spotlight the turning points of the narrative structure on the linked scenes. Deep and complex neural network models are investigated for MRS detection by taking multimodal features of scenes. Finally, a visualization and evaluation tool is proposed to display extracted narratives and evaluate them according to a third-party, human intervention.
À l'ère de l'explosion du contenu multimédia, il est nécessaire de proposer des méthodes automatiques permettant d'organiser les collections de documents multimédias. La structure narrative des collections peut aider à cet égard, en particulier dans les collections multimédias longues et continues, telles que les séries TV. Les séries TV actuelles sont composées de structures complexes impliquant plusieurs récits entrelacés au sein d'un même épisode, et ce jusqu'au dernier épisode de la série TV. Dans cette thèse, nous nous concentrons sur l'extraction et la description de la structure narrative des séries TV en considérant la fusion des caractéristiques multimodales et des éléments narratifs. La structure narrative des séries TV sont constitués d'unités atomiques narratives, les scènes. Par conséquent, travailler au niveau de la scène est la meilleure façon d'extraire et de comprendre la structure narrative globale. Dans cette thèse, nous avons proposé une nouvelle façon d'extraire et de comprendre la structure narrative en reliant les scènes. Pour ce faire, nous avons étudié la segmentation des scènes en utilisant des caractéristiques extraites de modèles neuronaux qui prennent en compte les modalités visuelles et textuelles des séries TV. Ensuite, nous avons proposé une nouvelle façon de relier les scènes par le biais d'un regroupement flou (fuzzy clustering), à différents niveaux de granularité. Le fuzzy clustering prend en compte les éléments narratifs des scènes pour créer les liens entre aux. Des liens inter et intra épisodes sont créés pour capturer la progression d'un récit tout au long de la série TV. Ensuite, les scènes les plus marquantes (MRS) sont détectées, afin de mettre en évidence les points d'inflexion de la structure narrative sur les scènes liées. Des modèles neuronaux profonds et complexes sont étudiés pour la détection des MRS à partir des caractéristiques multimodales des scènes. Enfin, un outil de visualisation et d'évaluation est proposé pour afficher les structures narratives extraites et permettre une évaluation humaine.
Fichier principal
Vignette du fichier
97665_BERHE_2021_archivage.pdf (3.33 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03467115 , version 2 (06-12-2021)
tel-03467115 , version 1 (10-12-2021)

Identifiants

  • HAL Id : tel-03467115 , version 2

Citer

Aman Berhe. Extraction of Narrative Structure from TV Series. Machine Learning [cs.LG]. Université Paris-Saclay, 2021. English. ⟨NNT : 2021UPASG078⟩. ⟨tel-03467115v2⟩
225 Consultations
603 Téléchargements

Partager

Gmail Facebook X LinkedIn More