Task description

This subtask is concerned with the classification of daily activities performed in a home environment (e.g. Cooking). The provided samples are multi-channel audio segments acquired by multiple microphone arrays at different positions. This means that spatial properties can be exploited to serve as input features to the classification problem. However, using absolute localization of sound sources as input for the detection model is doomed to not generalize well to cases where the position of the microphone array is altered. Therefore, in this task the focus is on systems which can exploit spatial cues independent of sensor location using multi-channel audio.

The development data consists of recording obtained by four microphone arrays at different positions. The evaluation dataset contained data of seven microphone arrays, consisting of the four microphone arrays available in the development set and three unknown microphone arrays. The former is used to provide quantative numbers on the spatial overfit while the latter is used to determine the winner of task 5.

More detailed task description can be found on the task description page

Systems ranking

Submission code	Submission name	Technical Report	F1-score on Eval. set (Unknown mic.)	F1-score on Eval. set (dev. set mic. arrays)	F1-score on Dev. set
DCASE2018 baseline	Baseline	Dekkers2018	83.1	85.0	84.5
Delphin_OL_task5_1	GCNN_PTS	Delphin-Poulat2018	80.7	86.1	88.5
Delphin_OL_task5_2	GCNN_FTS	Delphin-Poulat2018	80.8	85.0	88.6
Delphin_OL_task5_3	GCNN_ATS	Delphin-Poulat2018	81.6	84.9	86.0
Delphin_OL_task5_4	GCNN_F	Delphin-Poulat2018	82.5	86.5	88.7
Inoue_IBM_task5_1	InouetMilk	Inoue2018	88.4	90.4	90.0
Inoue_IBM_task5_2	InouetMilk	Inoue2018	88.3	90.5	90.0
Kong_Surrey_task5_1	SurreyCNN8	Kong2018	83.2	87.6	87.8
Kong_Surrey_task5_2	SurreyCNN4	Kong2018	82.4	86.2	87.8
Li_NPU_task5_1	CIAICSys1	Li2018	79.0	90.7	89.7
Li_NPU_task5_2	CIAICSys2	Li2018	78.6	90.4	89.7
Li_NPU_task5_3	CIAICSys3	Li2018	84.8	91.3	90.5
Li_NPU_task5_4	CIAICSys4	Li2018	85.1	91.4	90.7
Liao_NTHU_task5_1	NTHU_sub_4	Liao2018	86.7	88.6	88.7
Liao_NTHU_task5_2	NTHU_sub_MVDR	Liao2018	72.1	87.1	87.1
Liao_NTHU_task5_3	NTHU_sub_MVDRMMSE	Liao2018	76.7	85.7	85.5
Liu_THU_task5_1	Liu_THU	Liu2018	87.5	89.4	89.8
Liu_THU_task5_2	Liu_THU	Liu2018	87.4	89.5	89.8
Liu_THU_task5_3	Liu_THU	Liu2018	86.8	89.3	88.9
Nakadai_HRI-JP_task5_1	PS-CNN	Nakadai2018	85.4	89.9	89.9
Raveh_INRC_task5_1	INRC_1D	Raveh2018	80.4	87.7	87.2
Raveh_INRC_task5_2	INRC_1DSVD	Raveh2018	80.2	86.3	85.7
Raveh_INRC_task5_3	INRC_2D	Raveh2018	81.7	87.7	86.8
Raveh_INRC_task5_4	INRC_2DSVD	Raveh2018	81.2	86.4	85.8
Sun_SUTD_task5_1	SUTD	Chew2018	76.8	78.5	92.2
Tanabe_HIT_task5_1	HITavg	Tanabe2018	88.4	89.7	89.8
Tanabe_HIT_task5_2	HITrf	Tanabe2018	82.2	86.0	90.0
Tanabe_HIT_task5_3	HITsvm	Tanabe2018	86.3	89.2	90.3
Tanabe_HIT_task5_4	HITfweight	Tanabe2018	88.4	89.8	89.8
Tiraboschi_UNIMI_task5_1	TC2DCNN	Tiraboschi2018	76.9	85.8	85.8
Zhang_THU_task5_1	THUEE	Shen2018	85.9	87.6	89.7
Zhang_THU_task5_2	THUEE	Shen2018	84.3	86.2	91.2
Zhang_THU_task5_3	THUEE	Shen2018	86.0	87.5	90.5
Zhang_THU_task5_4	THUEE	Shen2018	85.9	87.6	90.4

Teams ranking

Table including only the best performing system per submitting team.

Submission code	Submission name	Technical Report	F1-score on Eval. set (Unknown mic.)	F1-score on Eval. set (dev. set mic. arrays)	F1-score (Dev. set)
DCASE2018 baseline	Baseline	Dekkers2018	83.1	85.0	84.5
Delphin_OL_task5_4	GCNN_F	Delphin-Poulat2018	82.5	86.5	88.7
Inoue_IBM_task5_1	InouetMilk	Inoue2018	88.4	90.4	90.0
Kong_Surrey_task5_1	SurreyCNN8	Kong2018	83.2	87.6	87.8
Li_NPU_task5_4	CIAICSys4	Li2018	85.1	91.4	90.7
Liao_NTHU_task5_1	NTHU_sub_4	Liao2018	86.7	88.6	88.7
Liu_THU_task5_1	Liu_THU	Liu2018	87.5	89.4	89.8
Nakadai_HRI-JP_task5_1	PS-CNN	Nakadai2018	85.4	89.9	89.9
Raveh_INRC_task5_3	INRC_2D	Raveh2018	81.7	87.7	86.8
Sun_SUTD_task5_1	SUTD	Chew2018	76.8	78.5	92.2
Tanabe_HIT_task5_1	HITavg	Tanabe2018	88.4	89.7	89.8
Tiraboschi_UNIMI_task5_1	TC2DCNN	Tiraboschi2018	76.9	85.8	85.8
Zhang_THU_task5_3	THUEE	Shen2018	86.0	87.5	90.5

Class-wise performance

Submission code	Submission name	Technical Report	F1-score on Eval. set (Unknown mic.)	Absence	Cooking	Dishwashing	Eating	Other	Social activity	Vacuum cleaning	Watching TV	Working	F1-score on Eval. set (dev. set mic. arrays)	Absence (2)	Cooking (2)	Dishwashing (2)	Eating (2)	Other (2)	Social activity (2)	Vacuum cleaning (2)	Watching TV (2)	Working (2)
DCASE2018 baseline	Baseline	Dekkers2018	83.1	87.7	93.0	77.2	81.2	35.0	96.6	95.8	99.9	81.4	85.0	89.4	96.3	79.5	82.0	44.1	96.4	95.9	99.9	81.5
Delphin_OL_task5_1	GCNN_PTS	Delphin-Poulat2018	80.7	79.9	85.5	70.1	79.3	45.5	96.0	95.7	99.9	74.5	86.1	91.0	96.1	79.6	82.5	48.4	96.5	96.4	99.9	84.7
Delphin_OL_task5_2	GCNN_FTS	Delphin-Poulat2018	80.8	79.1	88.5	71.4	79.9	42.7	94.6	97.0	99.9	74.2	85.0	90.5	96.0	78.5	81.0	44.1	95.1	97.0	99.9	83.2
Delphin_OL_task5_3	GCNN_ATS	Delphin-Poulat2018	81.6	83.8	90.5	71.3	78.6	44.0	94.7	96.1	99.9	76.0	84.9	91.3	95.3	75.9	81.8	45.5	94.5	96.5	99.9	83.1
Delphin_OL_task5_4	GCNN_F	Delphin-Poulat2018	82.5	82.2	89.5	73.8	81.1	47.4	95.5	96.7	100.0	76.2	86.5	92.0	96.2	80.4	83.1	49.3	95.8	96.8	99.9	85.3
Inoue_IBM_task5_1	InouetMilk	Inoue2018	88.4	93.7	91.5	86.5	87.0	54.2	97.0	97.1	99.9	88.7	90.4	94.2	96.8	88.4	89.9	59.7	97.4	97.3	100.0	90.0
Inoue_IBM_task5_2	InouetMilk	Inoue2018	88.3	93.6	91.7	86.1	87.0	53.6	97.0	97.1	99.9	88.7	90.5	94.2	96.9	89.4	90.2	59.5	97.4	97.2	99.9	90.2
Kong_Surrey_task5_1	SurreyCNN8	Kong2018	83.2	90.4	82.9	75.0	82.4	42.6	96.6	96.4	99.9	82.5	87.6	92.7	95.0	82.7	85.9	51.5	96.7	97.1	99.9	87.3
Kong_Surrey_task5_2	SurreyCNN4	Kong2018	82.4	87.4	84.2	74.3	78.4	45.4	96.4	96.6	99.9	79.1	86.2	90.7	94.6	81.0	83.0	48.9	96.5	97.5	99.9	83.4
Li_NPU_task5_1	CIAICSys1	Li2018	79.0	79.6	84.6	76.4	80.8	20.3	95.6	96.4	99.9	77.3	90.7	93.0	97.3	91.0	91.6	61.1	96.6	97.0	100.0	89.1
Li_NPU_task5_2	CIAICSys2	Li2018	78.6	81.5	85.7	78.2	74.1	24.4	92.1	95.4	99.7	76.1	90.4	92.4	97.2	91.3	92.0	59.4	96.2	96.8	100.0	88.6
Li_NPU_task5_3	CIAICSys3	Li2018	84.8	88.3	91.0	81.1	84.4	40.5	97.2	97.0	99.9	83.6	91.3	94.4	97.2	89.9	91.6	62.9	97.4	97.4	100.0	91.0
Li_NPU_task5_4	CIAICSys4	Li2018	85.1	88.1	91.3	82.9	84.7	42.2	96.6	97.1	100.0	83.3	91.4	94.3	97.4	90.3	91.8	63.1	97.5	97.3	100.0	90.8
Liao_NTHU_task5_1	NTHU_sub_4	Liao2018	86.7	91.0	95.1	81.7	82.1	52.3	97.9	95.3	100.0	85.3	88.6	92.6	96.7	88.0	85.3	55.7	97.8	95.0	100.0	86.7
Liao_NTHU_task5_2	NTHU_sub_MVDR	Liao2018	72.1	69.8	64.7	63.5	67.1	17.7	95.9	96.9	99.8	73.5	87.1	91.6	92.2	84.3	84.6	52.2	96.5	97.3	99.9	85.3
Liao_NTHU_task5_3	NTHU_sub_MVDRMMSE	Liao2018	76.7	77.4	68.3	63.6	77.2	38.2	96.0	96.0	99.8	73.9	85.7	91.7	88.2	77.4	84.7	50.1	96.6	96.7	99.9	86.0
Liu_THU_task5_1	Liu_THU	Liu2018	87.5	92.7	89.9	84.7	85.6	53.5	96.6	97.4	100.0	87.4	89.4	93.9	95.6	87.4	86.6	56.8	97.1	97.6	100.0	89.6
Liu_THU_task5_2	Liu_THU	Liu2018	87.4	92.9	90.5	84.2	85.0	52.1	97.0	97.3	100.0	87.5	89.5	93.9	96.3	87.3	86.9	56.3	97.4	97.8	100.0	89.6
Liu_THU_task5_3	Liu_THU	Liu2018	86.8	92.1	90.3	82.1	84.2	51.9	97.0	96.7	100.0	86.5	89.3	93.3	95.9	87.5	87.5	55.3	97.6	97.6	100.0	88.7
Nakadai_HRI-JP_task5_1	PS-CNN	Nakadai2018	85.4	84.6	92.7	81.6	84.5	51.1	97.3	97.0	100.0	80.0	89.9	93.4	96.8	88.3	89.0	57.7	97.3	96.8	100.0	89.4
Raveh_INRC_task5_1	INRC_1D	Raveh2018	80.4	74.8	84.1	71.9	81.5	47.6	95.1	97.1	99.9	71.5	87.7	89.3	96.0	85.9	86.1	53.5	97.0	97.8	99.9	84.2
Raveh_INRC_task5_2	INRC_1DSVD	Raveh2018	80.2	69.9	91.1	75.6	79.1	44.9	95.2	97.7	99.8	68.6	86.3	88.1	95.1	81.8	83.8	51.6	96.0	97.8	99.9	82.5
Raveh_INRC_task5_3	INRC_2D	Raveh2018	81.7	79.7	86.9	73.8	82.2	42.7	97.1	97.4	99.9	75.5	87.7	90.8	95.3	82.8	87.2	51.4	97.5	97.8	99.9	86.2
Raveh_INRC_task5_4	INRC_2DSVD	Raveh2018	81.2	75.8	87.5	73.2	80.0	48.4	95.9	96.6	99.9	73.4	86.4	89.8	94.1	78.6	84.8	51.9	96.8	96.8	99.9	84.9
Sun_SUTD_task5_1	SUTD	Chew2018	76.8	74.9	85.5	70.5	68.5	35.2	92.9	94.7	99.8	69.5	78.5	81.3	92.7	72.1	72.2	30.5	93.9	94.5	99.7	69.6
Tanabe_HIT_task5_1	HITavg	Tanabe2018	88.4	91.6	97.0	83.0	84.2	57.7	98.2	97.7	100.0	86.1	89.7	92.4	97.2	86.1	86.0	61.6	98.1	97.9	100.0	87.7
Tanabe_HIT_task5_2	HITrf	Tanabe2018	82.2	59.1	96.1	81.5	85.7	53.7	97.7	97.7	100.0	68.6	86.0	74.6	96.9	85.5	88.2	57.9	97.7	97.9	100.0	75.4
Tanabe_HIT_task5_3	HITsvm	Tanabe2018	86.3	86.1	95.8	81.6	85.2	54.6	95.9	96.7	100.0	81.3	89.2	92.6	96.7	85.4	88.1	57.3	96.6	97.2	100.0	88.7
Tanabe_HIT_task5_4	HITfweight	Tanabe2018	88.4	91.3	97.0	83.0	84.1	58.3	98.2	97.7	100.0	85.8	89.8	92.6	97.2	86.4	86.1	62.1	98.2	97.9	100.0	87.9
Tiraboschi_UNIMI_task5_1	TC2DCNN	Tiraboschi2018	76.9	79.8	88.7	71.8	78.9	17.6	96.2	94.4	99.7	64.6	85.8	90.8	93.6	77.5	83.2	50.5	97.4	94.1	100.0	85.0
Zhang_THU_task5_1	THUEE	Shen2018	85.9	92.8	88.6	78.7	81.9	50.3	97.5	96.3	99.9	87.5	87.6	93.1	94.6	80.8	85.1	52.8	97.5	96.6	99.9	88.0
Zhang_THU_task5_2	THUEE	Shen2018	84.3	93.6	85.1	76.8	76.6	46.6	97.1	96.5	99.9	86.9	86.2	94.1	89.7	79.0	80.7	50.6	96.7	97.1	99.9	88.0
Zhang_THU_task5_3	THUEE	Shen2018	86.0	93.6	87.4	79.7	80.1	50.8	97.6	96.7	99.9	87.7	87.5	94.2	92.2	81.5	83.2	53.3	97.4	97.1	100.0	88.8
Zhang_THU_task5_4	THUEE	Shen2018	85.9	93.5	87.4	79.0	79.9	51.3	97.6	96.7	99.9	87.7	87.6	94.1	92.4	81.4	83.5	53.7	97.6	97.1	100.0	88.8

System characteristics

Input characteristics

Code	Technical Report	F1-score on Eval. set (Unknown mic.)	F1-score on Eval. set (dev. set mic. arrays)	Acoustic features	Spatial features	Data augmentation	Pre-trained model
DCASE2018 baseline	Dekkers2018	83.1	85.0	log-mel energies
Delphin_OL_task5_1	Delphin-Poulat2018	80.7	86.1	log-mel energies
Delphin_OL_task5_2	Delphin-Poulat2018	80.8	85.0	log-mel energies
Delphin_OL_task5_3	Delphin-Poulat2018	81.6	84.9	log-mel energies		Gaussian Additive Noise
Delphin_OL_task5_4	Delphin-Poulat2018	82.5	86.5	log-mel energies		Gaussian Additive Noise
Inoue_IBM_task5_1	Inoue2018	88.4	90.4	log-mel energies		shuffling, mixing
Inoue_IBM_task5_2	Inoue2018	88.3	90.5	log-mel energies		shuffling, mixing
Kong_Surrey_task5_1	Kong2018	83.2	87.6	log-mel energies
Kong_Surrey_task5_2	Kong2018	82.4	86.2	log-mel energies
Li_NPU_task5_1	Li2018	79.0	90.7	log-mel energies	coherence
Li_NPU_task5_2	Li2018	78.6	90.4	log-mel energies	coherence
Li_NPU_task5_3	Li2018	84.8	91.3	log-mel energies	coherence
Li_NPU_task5_4	Li2018	85.1	91.4	log-mel energies	coherence
Liao_NTHU_task5_1	Liao2018	86.7	88.6	log-mel energies		time shifting
Liao_NTHU_task5_2	Liao2018	72.1	87.1	log-mel energies	MVDR	time shifting
Liao_NTHU_task5_3	Liao2018	76.7	85.7	log-mel energies	MVDR with MMSE	time shifting
Liu_THU_task5_1	Liu2018	87.5	89.4	log-mel energies, MFCC			VGGish
Liu_THU_task5_2	Liu2018	87.4	89.5	log-mel energies, MFCC			VGGish
Liu_THU_task5_3	Liu2018	86.8	89.3	log-mel energies, MFCC			VGGish
Nakadai_HRI-JP_task5_1	Nakadai2018	85.4	89.9	log-mel energies
Raveh_INRC_task5_1	Raveh2018	80.4	87.7	Scattering Transform
Raveh_INRC_task5_2	Raveh2018	80.2	86.3	Scattering Transform, SVD
Raveh_INRC_task5_3	Raveh2018	81.7	87.7	Scattering Transform
Raveh_INRC_task5_4	Raveh2018	81.2	86.4	Scattering Transform, SVD
Sun_SUTD_task5_1	Chew2018	76.8	78.5	MFCC, spectrogram
Tanabe_HIT_task5_1	Tanabe2018	88.4	89.7	log-mel energies, MFCC	multi-channel front-end processing		VGG16
Tanabe_HIT_task5_2	Tanabe2018	82.2	86.0	log-mel energies, MFCC	multi-channel front-end processing		VGG16
Tanabe_HIT_task5_3	Tanabe2018	86.3	89.2	log-mel energies, MFCC	Blind Source Seperation, Blind dereverberation, Beamformer		VGG16
Tanabe_HIT_task5_4	Tanabe2018	88.4	89.8	log-mel energies, MFCC	Blind Source Seperation, Blind dereverberation, Beamformer		VGG16
Tiraboschi_UNIMI_task5_1	Tiraboschi2018	76.9	85.8	log-mel energies
Zhang_THU_task5_1	Shen2018	85.9	87.6	log-mel energies, Time-Frequency Cepstral
Zhang_THU_task5_2	Shen2018	84.3	86.2	log-mel energies, Time-Frequency Cepstral
Zhang_THU_task5_3	Shen2018	86.0	87.5	log-mel energies, Time-Frequency Cepstral
Zhang_THU_task5_4	Shen2018	85.9	87.6	log-mel energies, Time-Frequency Cepstral

Machine learning characteristics

Code	Technical Report	F1-score on Eval. set (Unknown mic.)	F1-score on Eval. set (dev. set mic. arrays)	Classifier	Fusion level	Fusion method	Ensemble subsystems	Decision making
DCASE2018 baseline	Dekkers2018	83.1	85.0	CNN	decision	average
Delphin_OL_task5_1	Delphin-Poulat2018	80.7	86.1	CNN	decision	average
Delphin_OL_task5_2	Delphin-Poulat2018	80.8	85.0	CNN	decision	average
Delphin_OL_task5_3	Delphin-Poulat2018	81.6	84.9	CNN	decision	average
Delphin_OL_task5_4	Delphin-Poulat2018	82.5	86.5	CNN	decision	average
Inoue_IBM_task5_1	Inoue2018	88.4	90.4	CNN	decision	average	4	average
Inoue_IBM_task5_2	Inoue2018	88.3	90.5	CNN	decision	average	4	average
Kong_Surrey_task5_1	Kong2018	83.2	87.6	AlexNetish 8 layer CNN with global max pooling	decision	average
Kong_Surrey_task5_2	Kong2018	82.4	86.2	AlexNetish 4 layer CNN with global max pooling	decision	average
Li_NPU_task5_1	Li2018	79.0	90.7	CNN, VGG10, ensemble	decision	average	2	average
Li_NPU_task5_2	Li2018	78.6	90.4	CNN, VGG10, GLU, ensemble	decision	average	2	average
Li_NPU_task5_3	Li2018	84.8	91.3	CNN, VGG10, ensemble	decision	average	3	average
Li_NPU_task5_4	Li2018	85.1	91.4	CNN, VGG10, GLU, ensemble	decision	average	3	average
Liao_NTHU_task5_1	Liao2018	86.7	88.6	CNN	decision	average
Liao_NTHU_task5_2	Liao2018	72.1	87.1	CNN	decision	average
Liao_NTHU_task5_3	Liao2018	76.7	85.7	CNN	decision	average
Liu_THU_task5_1	Liu2018	87.5	89.4	CNN, RNN, ensemble	decision	average	3	average
Liu_THU_task5_2	Liu2018	87.4	89.5	CNN, RNN, ensemble	decision	average	3	average
Liu_THU_task5_3	Liu2018	86.8	89.3	CNN, RNN, ensemble	decision	average	3	average
Nakadai_HRI-JP_task5_1	Nakadai2018	85.4	89.9	Partially Shared CNN	decision	majority vote
Raveh_INRC_task5_1	Raveh2018	80.4	87.7	LSTM, CNN, ResNet	feature	average
Raveh_INRC_task5_2	Raveh2018	80.2	86.3	LSTM, CNN, ResNet	feature	average
Raveh_INRC_task5_3	Raveh2018	81.7	87.7	LSTM, CNN, ResNet	feature	average
Raveh_INRC_task5_4	Raveh2018	81.2	86.4	LSTM, CNN, ResNet	feature	average
Sun_SUTD_task5_1	Chew2018	76.8	78.5	CNN, LSTM, ensemble	decision	average	3	average
Tanabe_HIT_task5_1	Tanabe2018	88.4	89.7	CNN, SVM, VGG16, ensemble	audio, decision	Blind Source Seperation, Blind dereverberation, Beamformer, average	89	average
Tanabe_HIT_task5_2	Tanabe2018	82.2	86.0	CNN, SVM, VGG16, ensemble	audio, decision	Blind Source Seperation, Blind dereverberation, Beamformer, Random Forest	89	Random Forest
Tanabe_HIT_task5_3	Tanabe2018	86.3	89.2	CNN, SVM, VGG16, ensemble	audio, decision	Blind Source Seperation, Blind dereverberation, Beamformer, SVM	89	SVM
Tanabe_HIT_task5_4	Tanabe2018	88.4	89.8	CNN, SVM, VGG16, ensemble	audio, decision	Blind Source Seperation, Blind dereverberation, Beamformer, F1-score-weighted average	89	F1-score-weighted average
Tiraboschi_UNIMI_task5_1	Tiraboschi2018	76.9	85.8	CNN	classifier	CNN
Zhang_THU_task5_1	Shen2018	85.9	87.6	GCNN,GSV-SVM, ensemble	classifier	stacking	4
Zhang_THU_task5_2	Shen2018	84.3	86.2	GCNN,GSV-SVM,ensemble	classifier	stacking	4
Zhang_THU_task5_3	Shen2018	86.0	87.5	GCNN,GSV-SVM,ensemble	classifier	stacking	4
Zhang_THU_task5_4	Shen2018	85.9	87.6	GCNN,GSV-SVM,ensemble	classifier	stacking	4

Technical reports

DCASE 2018 Challenge: Solution for Task 5

Jeremy Chew, Yingxiang Sun, Lahiru Jayasinghe and Chau Yuen

Engineering Product Development, Singapore University of Technology and Design, Singapore

Sun_SUTD_task5_1

Input	all
Sampling rate	16kHz
Acoustic features	MFCC, spectrogram
Fusion level	decision
Fusion method	average
Classifier	CNN, LSTM, ensemble
Decision making	average

Input	all; mixed
Sampling rate	16kHz
Data augmentation	time shifting
Acoustic features	log-mel energies
Spatial features	MVDR; MVDR with MMSE
Fusion level	decision
Fusion method	average
Classifier	CNN

Content

Task description

Systems ranking

Teams ranking

Class-wise performance

System characteristics

Input characteristics

Machine learning characteristics

Technical reports

DCASE 2018 Challenge: Solution for Task 5

DCASE 2018 Challenge: Solution for Task 5

Abstract

System characteristics

DCASE 2018 Challenge - Task 5: Monitoring of Domestic Activities Based on Multi-Channel Acoustics

DCASE 2018 Challenge - Task 5: Monitoring of Domestic Activities Based on Multi-Channel Acoustics

Abstract

System characteristics

GCNN for Classification of Domestic Activities

GCNN for Classification of Domestic Activities

Abstract

System characteristics

Domestic Activities Classification Based on CNN Using Shuffling and Mixing Data Augmentation

Domestic Activities Classification Based on CNN Using Shuffling and Mixing Data Augmentation

Abstract

System characteristics

DCASE 2018 Challenge Baseline with Convolutional Neural Networks

DCASE 2018 Challenge Baseline with Convolutional Neural Networks

Abstract

System characteristics

Ciaic-Moda System for Dcase2018 Challenge Task5

Ciaic-Moda System for Dcase2018 Challenge Task5

Abstract

System characteristics

DCASE 2018 Task 5 Challenge Technical Report: Sound Event Classification by a Deep Neural Network with Attention and Minimum Variance Distortionless Response Enhancement

DCASE 2018 Task 5 Challenge Technical Report: Sound Event Classification by a Deep Neural Network with Attention and Minimum Variance Distortionless Response Enhancement

Abstract

System characteristics

An Ensemble System for Domestic Activity Recognition

An Ensemble System for Domestic Activity Recognition

Abstract

System characteristics

Partially-Shared Convolutional Neural Network for Classification of Multi-Channel Recorded Audio Signals

Partially-Shared Convolutional Neural Network for Classification of Multi-Channel Recorded Audio Signals

Abstract

System characteristics

Multi-Channel Audio Classification with Neural Network Using Scattering Transform

Multi-Channel Audio Classification with Neural Network Using Scattering Transform

Abstract

System characteristics

Home Activity Monitoring Based on Gated Convolutional Neural Networks and System Fusion

Home Activity Monitoring Based on Gated Convolutional Neural Networks and System Fusion

Abstract

System characteristics

Multichannel Acoustic Scene Classification by Blind Dereverberation, Blind Source Separation, Data Augmentation, and Model Ensembling

Multichannel Acoustic Scene Classification by Blind Dereverberation, Blind Source Separation, Data Augmentation, and Model Ensembling

Abstract

System characteristics

Monitoring of Domestic Activities Based on Multi-Channel Acoustics: A Time-Channel 2D-Convolutional Approach

Monitoring of Domestic Activities Based on Multi-Channel Acoustics: A Time-Channel 2D-Convolutional Approach

Abstract

System characteristics