Acoustic scene classification

Task description

The goal of acoustic scene classification task was to classify test recordings into one of predefined classes (15) that characterizes the environment in which they were recorded — for example park, home, office. The participants used 4680 10-second audio excerpts (13h of audio) to train their systems, and 1620 10-second audio excerpts (4h 30min of audio) were used for the challenge evaluation.

More detailed task description can be found in the task description page

Challenge results

Here you can find complete information on the submissions for Task 1: results on evaluation and development set (when reported by authors), class-wise results, technical reports and bibtex citations.

System outputs:

DCASE2017 Challenge Submissions Package (28.7 MB)

Systems ranking

Submission code	Submission name	Technical Report	Accuracy with 95% confidence interval (Evaluation dataset)	Accuracy (Development dataset)
Abrol_IITM_task1_1	Baseline	Abrol2017	65.7 (63.4 - 68.0)	88.1
Amiriparian_AU_task1_1	S2S-AE	Amiriparian2017	67.5 (65.3 - 69.8)	88.0
Amiriparian_AU_task1_2	Shahin_APTI	Amiriparian2017a	59.1 (56.7 - 61.5)	90.1
Biho_Sogang_task1_1	Biho1	Kim2017	56.5 (54.1 - 59.0)	75.9
Biho_Sogang_task1_2	Biho2	Kim2017	60.5 (58.1 - 62.9)	75.9
Bisot_TPT_task1_1	TPT1	Bisot2017	69.8 (67.6 - 72.1)	90.1
Bisot_TPT_task1_2	TPT2	Bisot2017	69.6 (67.3 - 71.8)	89.1
Chandrasekhar_IIITH_task1_1		Chandrasekhar2017	45.9 (43.4 - 48.3)	77.6
Chou_SINICA_task1_1	TP_CNN_cv1	Chou2017	57.1 (54.7 - 59.5)
Chou_SINICA_task1_2	SINICA	Chou2017	61.5 (59.2 - 63.9)
Chou_SINICA_task1_3	SINICA	Chou2017	59.8 (57.4 - 62.1)
Chou_SINICA_task1_4	SINICA	Chou2017	57.1 (54.7 - 59.5)
Dang_NCU_task1_1	andang1	Dang2017	62.7 (60.4 - 65.1)	82.0
Dang_NCU_task1_2	andang1	Dang2017	62.7 (60.4 - 65.1)	79.1
Dang_NCU_task1_3	andang1	Dang2017	63.7 (61.4 - 66.0)	81.6
Duppada_Seernet_task1_1	Seernet	Duppada2017	57.0 (54.6 - 59.4)	79.9
Duppada_Seernet_task1_2	Seernet	Duppada2017	59.9 (57.5 - 62.3)	81.9
Duppada_Seernet_task1_3	Seernet	Duppada2017	64.1 (61.7 - 66.4)	81.6
Duppada_Seernet_task1_4	Seernet	Duppada2017	63.0 (60.7 - 65.4)	84.8
Foleiss_UTFPR_task1_1	MLPFeats	Foleiss2017	64.5 (62.2 - 66.8)	78.0
Foleiss_UTFPR_task1_2	MLPFeatRF	Foleiss2017	66.9 (64.6 - 69.2)	80.0
Fonseca_MTG_task1_1	MTG	Fonseca2017	67.3 (65.1 - 69.6)	83.0
Fraile_UPM_task1_1	GAMMA-UPM	Fraile2017	58.3 (55.9 - 60.7)	79.8
Gong_MTG_task1_1	MTG_GBMVGG	Gong2017	61.2 (58.8 - 63.5)	86.8
Gong_MTG_task1_2	MTG_GBM	Gong2017	61.5 (59.1 - 63.9)	86.1
Gong_MTG_task1_3	MTG_VGG	Gong2017	61.9 (59.5 - 64.2)	84.0
Han_COCAI_task1_1	4fEnsemSel	Han2017	79.9 (78.0 - 81.9)	91.9
Han_COCAI_task1_2	4fMeanAll	Han2017	79.6 (77.7 - 81.6)	91.7
Han_COCAI_task1_3	FlEnsemSel	Han2017	80.4 (78.4 - 82.3)	91.9
Han_COCAI_task1_4	flMeanAll	Han2017	80.3 (78.4 - 82.2)	91.7
Hasan_BUET_task1_1	BUETBOSCH1	Hyder2017	74.1 (72.0 - 76.3)	88.1
Hasan_BUET_task1_2	BUETBOSCH2	Hyder2017	72.2 (70.0 - 74.3)	83.3
Hasan_BUET_task1_3	BUETBOSCH3	Hyder2017	68.6 (66.3 - 70.8)	89.8
Hasan_BUET_task1_4	BUETBOSCH4	Hyder2017	72.0 (69.8 - 74.2)	89.6
DCASE2017 baseline	Baseline	Heittola2017	61.0 (58.7 - 63.4)	74.8
Huang_THU_task1_1	wjhta	Huang2017	65.5 (63.2 - 67.8)	83.4
Huang_THU_task1_2	wjhta	Huang2017	65.4 (63.1 - 67.7)	84.4
Hussain_NUCES_task1_1		Hussain2017	56.7 (54.3 - 59.1)	90.7
Hussain_NUCES_task1_2		Hussain2017	59.5 (57.1 - 61.9)	90.4
Hussain_NUCES_task1_3		Hussain2017	59.9 (57.5 - 62.3)	90.0
Hussain_NUCES_task1_4		Hussain2017	55.4 (52.9 - 57.8)	88.9
Jallet_TUT_task1_1	CRNN-1	Jallet2017	60.7 (58.4 - 63.1)	78.9
Jallet_TUT_task1_2	CRNN-2	Jallet2017	61.2 (58.8 - 63.5)	80.8
Jimenez_CMU_task1_1	LapKernel	Jimenez2017	59.9 (57.6 - 62.3)	78.7
Kukanov_UEF_task1_1	K-CRNN	Kukanov2017	71.7 (69.5 - 73.9)	85.8
Kun_TUM_UAU_UP_task1_1	Wav_SVMs	Kun2017	64.2 (61.9 - 66.5)	83.2
Kun_TUM_UAU_UP_task1_2	Wav_GRUs	Kun2017	64.0 (61.7 - 66.3)	82.6
Lehner_JKU_task1_1	JKU_IVEC	Lehner2017	68.7 (66.4 - 71.0)	84.5
Lehner_JKU_task1_2	JKU_ALL_av	Lehner2017	66.8 (64.5 - 69.1)	87.7
Lehner_JKU_task1_3	JKU_CNN	Lehner2017	64.8 (62.5 - 67.1)	89.0
Lehner_JKU_task1_4	JKU_All_ca	Lehner2017	73.8 (71.7 - 76.0)	91.3
Li_SCUT_task1_1	LiSCUTt1_1	Li2017	53.7 (51.3 - 56.1)	91.0
Li_SCUT_task1_2	LiSCUTt1_2	Li2017	63.6 (61.3 - 66.0)	83.9
Li_SCUT_task1_3	LiSCUTt1_3	Li2017	61.7 (59.4 - 64.1)	83.1
Li_SCUT_task1_4	LiSCUTt1_4	Li2017	57.8 (55.4 - 60.2)	87.5
Maka_ZUT_task1_1	ASAWI	Maka2017	47.5 (45.1 - 50.0)	70.6
Mun_KU_task1_1	GAN_SKMUN	Mun2017	83.3 (81.5 - 85.1)	87.1
Park_ISPL_task1_1	ISPL	Park2017	72.6 (70.4 - 74.8)	83.6
Phan_UniLuebeck_task1_1	CNN	Phan2017	59.0 (56.6 - 61.4)	83.8
Phan_UniLuebeck_task1_2	ACNN	Phan2017	55.9 (53.5 - 58.3)	82.3
Phan_UniLuebeck_task1_3	CNN+	Phan2017	58.3 (55.9 - 60.7)	83.8
Phan_UniLuebeck_task1_4	ACNN+	Phan2017	58.0 (55.6 - 60.4)	82.3
Piczak_WUT_task1_1	amb200	Piczak2017	70.6 (68.4 - 72.8)	82.3
Piczak_WUT_task1_2	dishes	Piczak2017	69.6 (67.3 - 71.8)	82.7
Piczak_WUT_task1_3	amb100	Piczak2017	67.7 (65.4 - 69.9)	80.2
Piczak_WUT_task1_4	amb60	Piczak2017	62.0 (59.6 - 64.3)	79.0
Rakotomamonjy_UROUEN_task1_1	HBGS CNN	Rakotomamonjy2017	61.5 (59.2 - 63.9)	85.9
Rakotomamonjy_UROUEN_task1_2	HBGS CNN-4	Rakotomamonjy2017	62.7 (60.3 - 65.0)	85.3
Rakotomamonjy_UROUEN_task1_3	HBGS CNN-19	Rakotomamonjy2017	62.8 (60.4 - 65.1)	84.6
Schindler_AIT_task1_1	multires	Schindler2017	61.7 (59.4 - 64.1)	87.3
Schindler_AIT_task1_2	multires-p	Schindler2017	61.7 (59.4 - 64.1)	90.5
Vafeiadis_CERTH_task1_1	CERTH_1	Vafeiadis2017	61.0 (58.6 - 63.4)	80.4
Vafeiadis_CERTH_task1_2	CERTH_2	Vafeiadis2017	49.5 (47.1 - 51.9)	95.9
Vij_UIET_task1_1	Vij_UIET_1	Vij2017	61.2 (58.9 - 63.6)	77.3
Vij_UIET_task1_2	Vij_UIET_2	Vij2017	57.5 (55.1 - 59.9)	79.0
Vij_UIET_task1_3	Vij_UIET_3	Vij2017	59.6 (57.2 - 62.0)	78.0
Vij_UIET_task1_4	Vij_UIET_4	Vij2017	65.0 (62.7 - 67.3)	82.7
Waldekar_IITKGP_task1_1	IITKGP_ABSP_Fusion	Waldekar2017	67.0 (64.7 - 69.3)	86.3
Waldekar_IITKGP_task1_2	IITKGP_ABSP_Hierarchical	Waldekar2017	64.9 (62.6 - 67.2)	88.8
Xing_SCNU_task1_1	DCNN_vote	Weiping2017	74.8 (72.6 - 76.9)	87.6
Xing_SCNU_task1_2	DCNN_SVM	Weiping2017	77.7 (75.7 - 79.7)	89.9
Xu_NUDT_task1_1	XuCnnMFCC	Xu2017	68.5 (66.2 - 70.7)	85.3
Xu_NUDT_task1_2	XuCnnMFCC	Xu2017	67.5 (65.3 - 69.8)	87.4
Xu_PKU_task1_1	autolog1	Xu2017a	65.9 (63.6 - 68.2)	84.4
Xu_PKU_task1_2	autolog2	Xu2017a	66.7 (64.4 - 69.0)	84.4
Xu_PKU_task1_3	autolog3	Xu2017a	64.6 (62.3 - 67.0)	84.4
Yang_WHU_TASK1_1	MFS	Lu2017	61.5 (59.2 - 63.9)	81.3
Yang_WHU_TASK1_2	STD	Lu2017	65.2 (62.9 - 67.6)	80.3
Yang_WHU_TASK1_3	MFS+STD	Lu2017	62.8 (60.5 - 65.2)	82.0
Yang_WHU_TASK1_4	Pre-training	Lu2017	63.6 (61.3 - 66.0)	82.3
Yu_UOS_task1_1	UOS_DualIn	Jee-Weon2017	67.0 (64.7 - 69.3)	85.5
Yu_UOS_task1_2	UOS_BalCos	Jee-Weon2017	66.2 (63.9 - 68.5)	85.1
Yu_UOS_task1_3	UOS_DatDup	Jee-Weon2017	67.3 (65.1 - 69.6)	95.4
Yu_UOS_task1_4	UOS_res	Jee-Weon2017	70.6 (68.3 - 72.8)	95.8
Zhao_ADSC_task1_1	MResNet-34	Zhao2017	70.0 (67.8 - 72.2)	85.6
Zhao_ADSC_task1_2	Conv	Zhao2017	67.9 (65.6 - 70.2)	85.4
Zhao_UAU_UP_task1_1	GRNN	Zhao2017a	63.8 (61.5 - 66.2)	83.3

Teams ranking

Table including only the best performing system per submitting team.

Submission code	Submission name	Technical Report	Accuracy with 95% confidence interval (Evaluation dataset)	Accuracy (Development dataset)
Abrol_IITM_task1_1	Baseline	Abrol2017	65.7 (63.4 - 68.0)	88.1
Amiriparian_AU_task1_1	S2S-AE	Amiriparian2017	67.5 (65.3 - 69.8)	88.0
Amiriparian_AU_task1_2	Shahin_APTI	Amiriparian2017a	59.1 (56.7 - 61.5)	90.1
Biho_Sogang_task1_2	Biho2	Kim2017	60.5 (58.1 - 62.9)	75.9
Bisot_TPT_task1_1	TPT1	Bisot2017	69.8 (67.6 - 72.1)	90.1
Chandrasekhar_IIITH_task1_1		Chandrasekhar2017	45.9 (43.4 - 48.3)	77.6
Chou_SINICA_task1_2	SINICA	Chou2017	61.5 (59.2 - 63.9)
Dang_NCU_task1_3	andang1	Dang2017	63.7 (61.4 - 66.0)	81.6
Duppada_Seernet_task1_3	Seernet	Duppada2017	64.1 (61.7 - 66.4)	81.6
Foleiss_UTFPR_task1_2	MLPFeatRF	Foleiss2017	66.9 (64.6 - 69.2)	80.0
Fonseca_MTG_task1_1	MTG	Fonseca2017	67.3 (65.1 - 69.6)	83.0
Fraile_UPM_task1_1	GAMMA-UPM	Fraile2017	58.3 (55.9 - 60.7)	79.8
Gong_MTG_task1_3	MTG_VGG	Gong2017	61.9 (59.5 - 64.2)	84.0
Han_COCAI_task1_3	FlEnsemSel	Han2017	80.4 (78.4 - 82.3)	91.9
Hasan_BUET_task1_1	BUETBOSCH1	Hyder2017	74.1 (72.0 - 76.3)	88.1
DCASE2017 baseline	Baseline	Heittola2017	61.0 (58.7 - 63.4)	74.8
Huang_THU_task1_1	wjhta	Huang2017	65.5 (63.2 - 67.8)	83.4
Hussain_NUCES_task1_3		Hussain2017	59.9 (57.5 - 62.3)	90.0
Jallet_TUT_task1_2	CRNN-2	Jallet2017	61.2 (58.8 - 63.5)	80.8
Jimenez_CMU_task1_1	LapKernel	Jimenez2017	59.9 (57.6 - 62.3)	78.7
Kukanov_UEF_task1_1	K-CRNN	Kukanov2017	71.7 (69.5 - 73.9)	85.8
Kun_TUM_UAU_UP_task1_1	Wav_SVMs	Kun2017	64.2 (61.9 - 66.5)	83.2
Lehner_JKU_task1_4	JKU_All_ca	Lehner2017	73.8 (71.7 - 76.0)	91.3
Li_SCUT_task1_2	LiSCUTt1_2	Li2017	63.6 (61.3 - 66.0)	83.9
Maka_ZUT_task1_1	ASAWI	Maka2017	47.5 (45.1 - 50.0)	70.6
Mun_KU_task1_1	GAN_SKMUN	Mun2017	83.3 (81.5 - 85.1)	87.1
Park_ISPL_task1_1	ISPL	Park2017	72.6 (70.4 - 74.8)	83.6
Phan_UniLuebeck_task1_1	CNN	Phan2017	59.0 (56.6 - 61.4)	83.8
Piczak_WUT_task1_1	amb200	Piczak2017	70.6 (68.4 - 72.8)	82.3
Rakotomamonjy_UROUEN_task1_3	HBGS CNN-19	Rakotomamonjy2017	62.8 (60.4 - 65.1)	84.6
Schindler_AIT_task1_1	multires	Schindler2017	61.7 (59.4 - 64.1)	87.3
Vafeiadis_CERTH_task1_1	CERTH_1	Vafeiadis2017	61.0 (58.6 - 63.4)	80.4
Vij_UIET_task1_4	Vij_UIET_4	Vij2017	65.0 (62.7 - 67.3)	82.7
Waldekar_IITKGP_task1_1	IITKGP_ABSP_Fusion	Waldekar2017	67.0 (64.7 - 69.3)	86.3
Xing_SCNU_task1_2	DCNN_SVM	Weiping2017	77.7 (75.7 - 79.7)	89.9
Xu_NUDT_task1_1	XuCnnMFCC	Xu2017	68.5 (66.2 - 70.7)	85.3
Xu_PKU_task1_2	autolog2	Xu2017a	66.7 (64.4 - 69.0)	84.4
Yang_WHU_TASK1_2	STD	Lu2017	65.2 (62.9 - 67.6)	80.3
Yu_UOS_task1_4	UOS_res	Jee-Weon2017	70.6 (68.3 - 72.8)	95.8
Zhao_ADSC_task1_1	MResNet-34	Zhao2017	70.0 (67.8 - 72.2)	85.6
Zhao_UAU_UP_task1_1	GRNN	Zhao2017a	63.8 (61.5 - 66.2)	83.3

Class-wise performance

Submission code	Submission name	Technical Report	Accuracy (Evaluation dataset)	Beach	Bus	Cafe / Restaurant	Car	City center	Forest path	Grocery store	Home	Library	Metro station	Office	Park	Residential area	Train	Tram
Abrol_IITM_task1_1	Baseline	Abrol2017	65.7	73.1	61.1	88.9	81.5	82.4	44.4	73.1	72.2	35.2	75.0	86.1	32.4	49.1	75.0	55.6
Amiriparian_AU_task1_1	S2S-AE	Amiriparian2017	67.5	44.4	75.0	63.0	95.4	94.4	97.2	73.1	60.2	43.5	79.6	62.0	16.7	64.8	82.4	61.1
Amiriparian_AU_task1_2	Shahin_APTI	Amiriparian2017a	59.1	24.1	62.0	58.3	82.4	91.7	97.2	69.4	51.9	39.8	66.7	43.5	7.4	62.0	78.7	50.9
Biho_Sogang_task1_1	Biho1	Kim2017	56.5	24.1	33.3	33.3	75.9	61.1	80.6	50.9	88.9	27.8	99.1	57.4	17.6	88.0	55.6	54.6
Biho_Sogang_task1_2	Biho2	Kim2017	60.5	37.0	41.7	30.6	74.1	74.1	88.0	50.9	86.1	39.8	96.3	57.4	41.7	83.3	55.6	50.9
Bisot_TPT_task1_1	TPT1	Bisot2017	69.8	5.6	81.5	51.9	80.6	76.9	86.1	75.0	88.0	45.4	99.1	85.2	26.9	80.6	95.4	69.4
Bisot_TPT_task1_2	TPT2	Bisot2017	69.6	23.1	75.9	54.6	75.9	78.7	84.3	75.0	88.9	39.8	100.0	87.0	27.8	75.9	94.4	62.0
Chandrasekhar_IIITH_task1_1		Chandrasekhar2017	45.9	6.5	47.2	21.3	88.9	96.3	69.4	42.6	92.6	61.1	68.5	0.0	0.0	3.7	73.1	16.7
Chou_SINICA_task1_1	TP_CNN_cv1	Chou2017	57.1	25.9	40.7	48.1	75.0	80.6	88.9	58.3	67.6	19.4	80.6	62.0	21.3	61.1	69.4	57.4
Chou_SINICA_task1_2	SINICA	Chou2017	61.5	19.4	48.1	66.7	68.5	77.8	86.1	65.7	57.4	25.0	97.2	81.5	28.7	68.5	66.7	65.7
Chou_SINICA_task1_3	SINICA	Chou2017	59.8	32.4	50.0	49.1	74.1	88.9	88.9	62.0	59.3	36.1	92.6	57.4	20.4	50.0	69.4	65.7
Chou_SINICA_task1_4	SINICA	Chou2017	57.1	25.9	40.7	48.1	75.0	80.6	88.9	58.3	67.6	19.4	80.6	62.0	21.3	61.1	69.4	57.4
Dang_NCU_task1_1	andang1	Dang2017	62.7	32.4	49.1	61.1	65.7	76.9	87.0	57.4	90.7	26.9	95.4	82.4	24.1	75.0	70.4	46.3
Dang_NCU_task1_2	andang1	Dang2017	62.7	24.1	38.9	68.5	66.7	76.9	71.3	65.7	67.6	20.4	99.1	95.4	30.6	77.8	69.4	68.5
Dang_NCU_task1_3	andang1	Dang2017	63.7	28.7	49.1	61.1	71.3	69.4	88.9	59.3	83.3	34.3	100.0	84.3	25.0	83.3	72.2	45.4
Duppada_Seernet_task1_1	Seernet	Duppada2017	57.0	13.0	35.2	51.9	88.0	85.2	86.1	52.8	68.5	25.0	28.7	72.2	35.2	82.4	71.3	60.2
Duppada_Seernet_task1_2	Seernet	Duppada2017	59.9	8.3	39.8	57.4	96.3	75.9	88.0	58.3	79.6	34.3	23.1	86.1	40.7	78.7	74.1	57.4
Duppada_Seernet_task1_3	Seernet	Duppada2017	64.1	10.2	49.1	45.4	77.8	89.8	85.2	54.6	81.5	38.9	97.2	94.4	25.0	80.6	75.0	56.5
Duppada_Seernet_task1_4	Seernet	Duppada2017	63.0	13.9	42.6	57.4	85.2	85.2	87.0	57.4	83.3	35.2	63.9	88.9	31.5	81.5	72.2	60.2
Foleiss_UTFPR_task1_1	MLPFeats	Foleiss2017	64.5	18.5	47.2	65.7	75.0	86.1	84.3	63.9	89.8	52.8	99.1	54.6	15.7	77.8	65.7	71.3
Foleiss_UTFPR_task1_2	MLPFeatRF	Foleiss2017	66.9	13.9	49.1	68.5	75.9	87.0	91.7	69.4	99.1	50.9	99.1	63.0	18.5	78.7	69.4	69.4
Fonseca_MTG_task1_1	MTG	Fonseca2017	67.3	36.1	41.7	62.0	75.9	75.0	92.6	57.4	84.3	41.7	99.1	89.8	38.9	76.9	76.9	62.0
Fraile_UPM_task1_1	GAMMA-UPM	Fraile2017	58.3	61.1	46.3	47.2	76.9	88.9	65.7	48.1	95.4	35.2	63.0	24.1	29.6	63.9	75.0	53.7
Gong_MTG_task1_1	MTG_GBMVGG	Gong2017	61.2	50.0	45.4	66.7	67.6	66.7	89.8	62.0	81.5	27.8	85.2	35.2	34.3	68.5	80.6	56.5
Gong_MTG_task1_2	MTG_GBM	Gong2017	61.5	41.7	43.5	66.7	70.4	64.8	93.5	51.9	95.4	32.4	88.9	37.0	43.5	67.6	71.3	53.7
Gong_MTG_task1_3	MTG_VGG	Gong2017	61.9	64.8	46.3	66.7	71.3	68.5	84.3	71.3	76.9	24.1	55.6	84.3	22.2	57.4	76.9	57.4
Han_COCAI_task1_1	4fEnsemSel	Han2017	79.9	75.9	66.7	82.4	92.6	86.1	98.1	80.6	93.5	54.6	100.0	87.0	47.2	75.0	96.3	63.0
Han_COCAI_task1_2	4fMeanAll	Han2017	79.6	75.0	65.7	82.4	92.6	86.1	98.1	78.7	92.6	55.6	100.0	85.2	49.1	75.0	96.3	62.0
Han_COCAI_task1_3	FlEnsemSel	Han2017	80.4	78.7	71.3	83.3	93.5	88.9	98.1	79.6	94.4	53.7	100.0	86.1	44.4	75.9	90.7	66.7
Han_COCAI_task1_4	flMeanAll	Han2017	80.3	77.8	73.1	82.4	92.6	90.7	98.1	76.9	93.5	52.8	100.0	84.3	48.1	76.9	90.7	66.7
Hasan_BUET_task1_1	BUETBOSCH1	Hyder2017	74.1	87.0	59.3	91.7	92.6	94.4	91.7	81.5	97.2	47.2	76.9	49.1	38.0	58.3	81.5	65.7
Hasan_BUET_task1_2	BUETBOSCH2	Hyder2017	72.2	69.4	61.1	65.7	94.4	81.5	93.5	66.7	91.7	38.9	100.0	83.3	36.1	61.1	77.8	61.1
Hasan_BUET_task1_3	BUETBOSCH3	Hyder2017	68.6	77.8	70.4	95.4	86.1	86.1	84.3	71.3	98.1	50.0	40.7	22.2	41.7	68.5	83.3	52.8
Hasan_BUET_task1_4	BUETBOSCH4	Hyder2017	72.0	83.3	72.2	94.4	85.2	88.0	88.0	71.3	98.1	54.6	60.2	26.9	44.4	75.0	83.3	54.6
DCASE2017 baseline	Baseline	Heittola2017	61.0	40.7	38.9	43.5	64.8	79.6	85.2	49.1	76.9	30.6	93.5	73.1	32.4	77.8	72.2	57.4
Huang_THU_task1_1	wjhta	Huang2017	65.5	22.2	50.9	57.4	60.2	77.8	96.3	65.7	90.7	46.3	99.1	77.8	21.3	75.9	73.1	67.6
Huang_THU_task1_2	wjhta	Huang2017	65.4	30.6	48.1	63.9	65.7	76.9	95.4	63.9	91.7	37.0	99.1	77.8	10.2	75.9	79.6	64.8
Hussain_NUCES_task1_1		Hussain2017	56.7	25.9	27.8	49.1	42.6	73.1	88.9	57.4	88.0	4.6	100.0	66.7	29.6	83.3	51.9	61.1
Hussain_NUCES_task1_2		Hussain2017	59.5	28.7	37.0	37.0	73.1	67.6	79.6	55.6	84.3	27.8	100.0	67.6	24.1	85.2	59.3	65.7
Hussain_NUCES_task1_3		Hussain2017	59.9	22.2	36.1	39.8	71.3	74.1	78.7	57.4	85.2	45.4	97.2	67.6	24.1	85.2	55.6	58.3
Hussain_NUCES_task1_4		Hussain2017	55.4	38.9	21.3	59.3	40.7	69.4	92.6	54.6	75.0	14.8	80.6	67.6	20.4	81.5	53.7	60.2
Jallet_TUT_task1_1	CRNN-1	Jallet2017	60.7	15.7	51.9	61.1	75.0	88.0	88.9	56.5	65.7	27.8	87.0	91.7	21.3	55.6	80.6	44.4
Jallet_TUT_task1_2	CRNN-2	Jallet2017	61.2	24.1	55.6	62.0	70.4	88.9	90.7	63.9	70.4	29.6	87.0	84.3	23.1	55.6	72.2	39.8
Jimenez_CMU_task1_1	LapKernel	Jimenez2017	59.9	69.4	43.5	65.7	72.2	62.0	79.6	47.2	73.1	26.9	76.9	81.5	25.9	63.0	62.0	50.0
Kukanov_UEF_task1_1	K-CRNN	Kukanov2017	71.7	43.5	47.2	77.8	79.6	85.2	99.1	73.1	76.9	35.2	100.0	95.4	46.3	74.1	83.3	59.3
Kun_TUM_UAU_UP_task1_1	Wav_SVMs	Kun2017	64.2	61.1	44.4	72.2	68.5	76.9	83.3	48.1	64.8	28.7	92.6	90.7	39.8	56.5	75.9	59.3
Kun_TUM_UAU_UP_task1_2	Wav_GRUs	Kun2017	64.0	50.0	49.1	67.6	67.6	89.8	88.0	62.0	81.5	24.1	88.0	65.7	36.1	58.3	73.1	59.3
Lehner_JKU_task1_1	JKU_IVEC	Lehner2017	68.7	91.7	65.7	79.6	76.9	70.4	90.7	65.7	88.0	58.3	76.9	50.9	22.2	75.9	71.3	46.3
Lehner_JKU_task1_2	JKU_ALL_av	Lehner2017	66.8	57.4	64.8	73.1	80.6	91.7	88.9	79.6	77.8	35.2	64.8	71.3	36.1	38.0	83.3	59.3
Lehner_JKU_task1_3	JKU_CNN	Lehner2017	64.8	47.2	59.3	73.1	78.7	88.0	87.0	75.0	74.1	31.5	63.0	69.4	48.1	37.0	83.3	57.4
Lehner_JKU_task1_4	JKU_All_ca	Lehner2017	73.8	87.0	66.7	88.9	80.6	92.6	92.6	76.9	88.9	49.1	79.6	65.7	45.4	55.6	84.3	53.7
Li_SCUT_task1_1	LiSCUTt1_1	Li2017	53.7	14.8	38.0	50.9	55.6	83.3	68.5	60.2	95.4	20.4	80.6	34.3	17.6	70.4	54.6	61.1
Li_SCUT_task1_2	LiSCUTt1_2	Li2017	63.6	55.6	45.4	55.6	53.7	87.0	81.5	75.0	99.1	26.9	97.2	62.0	11.1	79.6	56.5	68.5
Li_SCUT_task1_3	LiSCUTt1_3	Li2017	61.7	51.9	33.3	48.1	64.8	83.3	82.4	70.4	99.1	24.1	99.1	50.0	14.8	78.7	53.7	72.2
Li_SCUT_task1_4	LiSCUTt1_4	Li2017	57.8	35.2	38.9	48.1	60.2	84.3	81.5	65.7	97.2	25.9	80.6	38.0	15.7	70.4	55.6	69.4
Maka_ZUT_task1_1	ASAWI	Maka2017	47.5	60.2	40.7	61.1	57.4	31.5	65.7	44.4	78.7	16.7	33.3	45.4	0.9	69.4	59.3	48.1
Mun_KU_task1_1	GAN_SKMUN	Mun2017	83.3	83.3	74.1	88.0	93.5	94.4	95.4	82.4	88.0	75.9	88.0	92.6	75.9	86.1	67.6	63.9
Park_ISPL_task1_1	ISPL	Park2017	72.6	54.6	59.3	71.3	79.6	91.7	85.2	75.0	98.1	44.4	98.1	84.3	23.1	76.9	82.4	64.8
Phan_UniLuebeck_task1_1	CNN	Phan2017	59.0	38.9	48.1	61.1	82.4	60.2	80.6	65.7	73.1	38.9	85.2	34.3	32.4	58.3	71.3	54.6
Phan_UniLuebeck_task1_2	ACNN	Phan2017	55.9	41.7	45.4	51.9	79.6	56.5	67.6	62.0	70.4	35.2	88.9	33.3	31.5	52.8	72.2	50.0
Phan_UniLuebeck_task1_3	CNN+	Phan2017	58.3	41.7	44.4	68.5	74.1	57.4	94.4	66.7	66.7	27.8	68.5	76.9	21.3	40.7	71.3	54.6
Phan_UniLuebeck_task1_4	ACNN+	Phan2017	58.0	53.7	47.2	64.8	75.0	59.3	91.7	61.1	70.4	28.7	75.9	69.4	14.8	34.3	68.5	55.6
Piczak_WUT_task1_1	amb200	Piczak2017	70.6	29.6	66.7	71.3	71.3	91.7	80.6	46.3	88.0	56.5	99.1	69.4	49.1	75.9	81.5	82.4
Piczak_WUT_task1_2	dishes	Piczak2017	69.6	32.4	63.9	65.7	77.8	91.7	84.3	49.1	76.9	67.6	99.1	56.5	56.5	67.6	82.4	72.2
Piczak_WUT_task1_3	amb100	Piczak2017	67.7	22.2	66.7	65.7	74.1	90.7	86.1	35.2	81.5	59.3	98.1	78.7	41.7	64.8	81.5	68.5
Piczak_WUT_task1_4	amb60	Piczak2017	62.0	19.4	63.9	51.9	65.7	89.8	88.9	21.3	67.6	43.5	92.6	81.5	43.5	73.1	63.9	63.0
Rakotomamonjy_UROUEN_task1_1	HBGS CNN	Rakotomamonjy2017	61.5	9.3	74.1	41.7	83.3	84.3	87.0	64.8	96.3	40.7	87.0	26.9	37.0	50.9	81.5	58.3
Rakotomamonjy_UROUEN_task1_2	HBGS CNN-4	Rakotomamonjy2017	62.7	6.5	77.8	47.2	82.4	88.9	87.0	68.5	92.6	38.0	95.4	35.2	33.3	48.1	85.2	53.7
Rakotomamonjy_UROUEN_task1_3	HBGS CNN-19	Rakotomamonjy2017	62.8	5.6	78.7	48.1	83.3	88.9	84.3	65.7	93.5	38.9	93.5	40.7	29.6	49.1	87.0	54.6
Schindler_AIT_task1_1	multires	Schindler2017	61.7	47.2	55.6	65.7	69.4	98.1	87.0	46.3	74.1	18.5	47.2	71.3	55.6	74.1	82.4	33.3
Schindler_AIT_task1_2	multires-p	Schindler2017	61.7	56.5	56.5	62.0	66.7	99.1	91.7	45.4	75.9	25.0	37.0	79.6	40.7	63.0	88.9	38.0
Vafeiadis_CERTH_task1_1	CERTH_1	Vafeiadis2017	61.0	23.1	42.6	58.3	66.7	77.8	86.1	64.8	94.4	39.8	92.6	54.6	20.4	72.2	81.5	39.8
Vafeiadis_CERTH_task1_2	CERTH_2	Vafeiadis2017	49.5	35.2	23.1	58.3	63.0	90.7	90.7	57.4	61.1	20.4	38.0	53.7	25.9	45.4	59.3	20.4
Vij_UIET_task1_1	Vij_UIET_1	Vij2017	61.2	22.2	39.8	43.5	73.1	77.8	90.7	64.8	83.3	43.5	95.4	52.8	28.7	77.8	59.3	65.7
Vij_UIET_task1_2	Vij_UIET_2	Vij2017	57.5	21.3	32.4	36.1	64.8	73.1	79.6	50.9	71.3	35.2	99.1	66.7	30.6	83.3	54.6	63.9
Vij_UIET_task1_3	Vij_UIET_3	Vij2017	59.6	10.2	42.6	36.1	53.7	75.0	79.6	54.6	88.0	48.1	98.1	57.4	39.8	88.0	58.3	63.9
Vij_UIET_task1_4	Vij_UIET_4	Vij2017	65.0	16.7	38.9	65.7	74.1	84.3	98.1	64.8	85.2	40.7	98.1	84.3	25.9	69.4	70.4	58.3
Waldekar_IITKGP_task1_1	IITKGP_ABSP_Fusion	Waldekar2017	67.0	13.9	61.1	76.9	70.4	86.1	90.7	63.0	85.2	49.1	98.1	81.5	19.4	80.6	73.1	56.5
Waldekar_IITKGP_task1_2	IITKGP_ABSP_Hierarchical	Waldekar2017	64.9	15.7	58.3	78.7	63.9	82.4	84.3	63.0	88.0	50.0	97.2	84.3	15.7	70.4	70.4	50.9
Xing_SCNU_task1_1	DCNN_vote	Weiping2017	74.8	77.8	88.0	71.3	81.5	78.7	73.1	76.9	67.6	49.1	95.4	82.4	57.4	73.1	88.0	61.1
Xing_SCNU_task1_2	DCNN_SVM	Weiping2017	77.7	71.3	84.3	79.6	85.2	82.4	78.7	80.6	73.1	59.3	97.2	81.5	57.4	85.2	92.6	57.4
Xu_NUDT_task1_1	XuCnnMFCC	Xu2017	68.5	27.8	43.5	70.4	84.3	88.0	96.3	66.7	91.7	40.7	100.0	85.2	13.9	82.4	72.2	63.9
Xu_NUDT_task1_2	XuCnnMFCC	Xu2017	67.5	26.9	43.5	68.5	85.2	88.0	94.4	66.7	86.1	42.6	100.0	85.2	11.1	82.4	72.2	60.2
Xu_PKU_task1_1	autolog1	Xu2017a	65.9	29.6	42.6	58.3	80.6	79.6	98.1	67.6	51.9	53.7	100.0	90.7	32.4	70.4	75.0	58.3
Xu_PKU_task1_2	autolog2	Xu2017a	66.7	28.7	32.4	59.3	84.3	77.8	99.1	69.4	50.0	36.1	100.0	99.1	38.9	72.2	74.1	79.6
Xu_PKU_task1_3	autolog3	Xu2017a	64.6	25.0	37.0	60.2	84.3	74.1	98.1	64.8	43.5	33.3	100.0	94.4	25.0	68.5	84.3	76.9
Yang_WHU_TASK1_1	MFS	Lu2017	61.5	10.2	55.6	52.8	76.9	79.6	94.4	50.0	79.6	30.6	94.4	55.6	33.3	68.5	75.9	65.7
Yang_WHU_TASK1_2	STD	Lu2017	65.2	45.4	47.2	57.4	74.1	86.1	88.0	55.6	75.0	49.1	98.1	68.5	29.6	66.7	75.0	63.0
Yang_WHU_TASK1_3	MFS+STD	Lu2017	62.8	53.7	42.6	54.6	78.7	88.9	88.9	61.1	75.9	47.2	90.7	48.1	15.7	61.1	71.3	63.9
Yang_WHU_TASK1_4	Pre-training	Lu2017	63.6	42.6	45.4	57.4	71.3	97.2	89.8	51.9	81.5	38.0	99.1	62.0	20.4	67.6	70.4	60.2
Yu_UOS_task1_1	UOS_DualIn	Jee-Weon2017	67.0	53.7	57.4	53.7	73.1	76.9	82.4	65.7	94.4	42.6	99.1	75.0	29.6	79.6	69.4	52.8
Yu_UOS_task1_2	UOS_BalCos	Jee-Weon2017	66.2	55.6	57.4	47.2	72.2	75.9	83.3	65.7	92.6	43.5	99.1	75.0	27.8	77.8	69.4	50.0
Yu_UOS_task1_3	UOS_DatDup	Jee-Weon2017	67.3	60.2	58.3	56.5	69.4	76.9	84.3	68.5	90.7	46.3	94.4	72.2	28.7	79.6	72.2	51.9
Yu_UOS_task1_4	UOS_res	Jee-Weon2017	70.6	72.2	51.9	68.5	76.9	77.8	86.1	74.1	93.5	38.9	95.4	77.8	34.3	84.3	68.5	58.3
Zhao_ADSC_task1_1	MResNet-34	Zhao2017	70.0	41.7	69.4	69.4	93.5	63.9	98.1	71.3	79.6	32.4	100.0	81.5	37.0	84.3	68.5	59.3
Zhao_ADSC_task1_2	Conv	Zhao2017	67.9	13.0	55.6	67.6	95.4	70.4	100.0	73.1	90.7	45.4	99.1	83.3	20.4	69.4	80.6	54.6
Zhao_UAU_UP_task1_1	GRNN	Zhao2017a	63.8	47.2	46.3	70.4	66.7	77.8	88.9	65.7	85.2	28.7	86.1	70.4	38.0	56.5	74.1	55.6

System characteristics

Code	Name	Technical Report	Accuracy (Eval)	Input	Sampling rate	Data augmentation	Features	Classifier	Decision making
Abrol_IITM_task1_1	Baseline	Abrol2017	65.7	mono	44.1kHz		CQT	GMM, Archetypal Analysis, SVM	majority vote on audio segments of a file
Amiriparian_AU_task1_1	S2S-AE	Amiriparian2017	67.5	mixed	44.1kHz		log-mel energies	MLP
Amiriparian_AU_task1_2	Shahin_APTI	Amiriparian2017a	59.1	mixed	44.1kHz		log-mel energies	MLP+SVM	weighted late fusion
Biho_Sogang_task1_1	Biho1	Kim2017	56.5	mono	44.1kHz		log-mel energies	CNN	majority vote
Biho_Sogang_task1_2	Biho2	Kim2017	60.5	mono	44.1kHz		log-mel energies	CNN	majority vote
Bisot_TPT_task1_1	TPT1	Bisot2017	69.8	left, right	44.1kHz		CQT	NMF, MLP	average log-probability
Bisot_TPT_task1_2	TPT2	Bisot2017	69.6	left, right	44.1kHz		CQT	NMF	average log-probability
Chandrasekhar_IIITH_task1_1		Chandrasekhar2017	45.9	mono	44.1kHz		MFCC, Inverse Melfrequency cepstral coefficients	DNN	majority vote
Chou_SINICA_task1_1	TP_CNN_cv1	Chou2017	57.1	mono	44.1kHz		spectrogram	CNN	majority vote
Chou_SINICA_task1_2	SINICA	Chou2017	61.5	mono	44.1kHz		spectrogram	CNN	majority vote
Chou_SINICA_task1_3	SINICA	Chou2017	59.8	mono	44.1kHz		spectrogram	CNN	majority vote
Chou_SINICA_task1_4	SINICA	Chou2017	57.1	mono	44.1kHz		spectrogram	ensemble	majority vote
Dang_NCU_task1_1	andang1	Dang2017	62.7	mono	44.1kHz		MFCC	CRNN	majority vote
Dang_NCU_task1_2	andang1	Dang2017	62.7	mono	44.1kHz		log-mel energies	CNN	majority vote
Dang_NCU_task1_3	andang1	Dang2017	63.7	mono	44.1kHz		log-mel energies, MFCC	CNN	majority vote
Duppada_Seernet_task1_1	Seernet	Duppada2017	57.0	mono	44.1kHz		log-mel spectrogram	CNN	mean
Duppada_Seernet_task1_2	Seernet	Duppada2017	59.9	mono	16kHz		log-mel spectrogram	CNN	mean
Duppada_Seernet_task1_3	Seernet	Duppada2017	64.1	mono	16kHz		log-mel spectrogram	CNN	mean
Duppada_Seernet_task1_4	Seernet	Duppada2017	63.0	mono	44.1kHz, 16kHz		log-mel spectrogram	CNN, ensemble	mean
Foleiss_UTFPR_task1_1	MLPFeats	Foleiss2017	64.5	mono	44.1kHz		STFT	MLP	probability sum
Foleiss_UTFPR_task1_2	MLPFeatRF	Foleiss2017	66.9	mono	44.1kHz		STFT	MLP, random forest	majority vote
Fonseca_MTG_task1_1	MTG	Fonseca2017	67.3	mono	44.1kHz		various	ensemble	max of average score
Fraile_UPM_task1_1	GAMMA-UPM	Fraile2017	58.3	binaural	44.1kHz		modulation spectrum	MLP	a posteriori probablity
Gong_MTG_task1_1	MTG_GBMVGG	Gong2017	61.2	multichannel	44.1kHz		various	GBM CNN fusion	maximum
Gong_MTG_task1_2	MTG_GBM	Gong2017	61.5	multichannel	44.1kHz		various	GBM fusion	maximum
Gong_MTG_task1_3	MTG_VGG	Gong2017	61.9	multichannel	44.1kHz		log-mel energies	CNN fusion	maximum
Han_COCAI_task1_1	4fEnsemSel	Han2017	79.9	mono, binaural	44.1kHz		log-mel energies	CNN, ensemble	mean probability
Han_COCAI_task1_2	4fMeanAll	Han2017	79.6	mono, binaural	44.1kHz		log-mel energies	CNN, ensemble	mean probability
Han_COCAI_task1_3	FlEnsemSel	Han2017	80.4	mono, binaural	44.1kHz		log-mel energies	CNN, ensemble	mean probability
Han_COCAI_task1_4	flMeanAll	Han2017	80.3	mono, binaural	44.1kHz		log-mel energies	CNN, ensemble	mean probability
Hasan_BUET_task1_1	BUETBOSCH1	Hyder2017	74.1	mono	44.1kHz		MFCC, log-mel energies	GMM-SV, CNN-SV, Multiband CNN-SV	majority vote
Hasan_BUET_task1_2	BUETBOSCH2	Hyder2017	72.2	mono	44.1kHz		log-mel energies	CNN-SV	majority vote
Hasan_BUET_task1_3	BUETBOSCH3	Hyder2017	68.6	mono	44.1kHz		MFCC, log-mel energies	GMM-SV, CNN-SV, Multiband CNN-SV, CNN, Multiband CNN	majority vote
Hasan_BUET_task1_4	BUETBOSCH4	Hyder2017	72.0	mono	44.1kHz		MFCC, log-mel energies, different functionals of various spectral and prosodic features	GMM-SV, CNN-SV, Multiband CNN-SV, CNN, Multiband CNN, DNN	majority vote
DCASE2017 baseline	Baseline	Heittola2017	61.0	mono	44.1kHz		log-mel energies	MLP	majority vote
Huang_THU_task1_1	wjhta	Huang2017	65.5	mono	44.1kHz		MFCC, CQT	CNN	majority vote
Huang_THU_task1_2	wjhta	Huang2017	65.4	mono	44.1kHz	pitch shifting	MFCC, CQT	CNN	majority vote
Hussain_NUCES_task1_1		Hussain2017	56.7	binaural	44.1kHz		log-mel energies	CNN
Hussain_NUCES_task1_2		Hussain2017	59.5	binaural	44.1kHz		log-mel energies	DNN
Hussain_NUCES_task1_3		Hussain2017	59.9	binaural	44.1kHz		log-mel energies	DNN
Hussain_NUCES_task1_4		Hussain2017	55.4	binaural	44.1kHz		log-mel energies	CNN
Jallet_TUT_task1_1	CRNN-1	Jallet2017	60.7	mono	44.1kHz		log-mel energies	CRNN	maximum
Jallet_TUT_task1_2	CRNN-2	Jallet2017	61.2	mono	44.1kHz		log-mel energies	CRNN	majority vote
Jimenez_CMU_task1_1	LapKernel	Jimenez2017	59.9	mono	44.1kHz		emo_conf (opensmile)	SVM	highest score
Kukanov_UEF_task1_1	K-CRNN	Kukanov2017	71.7	mono	44.1kHz		log-mel energies	CRNN	majority vote
Kun_TUM_UAU_UP_task1_1	Wav_SVMs	Kun2017	64.2	mono	44.1kHz		wavelets, ComParE (openSMILE)	SVM	margin sampling value
Kun_TUM_UAU_UP_task1_2	Wav_GRUs	Kun2017	64.0	mono	44.1kHz		wavelets, ComParE (openSMILE)	GRNN	margin sampling value
Lehner_JKU_task1_1	JKU_IVEC	Lehner2017	68.7	binaural	22.05kHz	pitch shifting	MFCC based i-vectors	i-vector	min. cosine distance
Lehner_JKU_task1_2	JKU_ALL_av	Lehner2017	66.8	mono, binaural	22.05kHz	pitch shifting	MFCC, log-scaled spectrogram	CNN, i-vector, ensemble	model averaging
Lehner_JKU_task1_3	JKU_CNN	Lehner2017	64.8	mono	22.05kHz		log-scaled spectrogram	CNN, ensemble	fusion w/ logistic linear regression
Lehner_JKU_task1_4	JKU_All_ca	Lehner2017	73.8	mono, binaural	22.05kHz	pitch shifting	mel-scaled spectrograms, i-vectors	i-vector, CNN, ensemble	fusion w/ logistic linear regression
Li_SCUT_task1_1	LiSCUTt1_1	Li2017	53.7	mono	44.1kHz		DNN(MFCC)	Bi-LSTM	majority vote
Li_SCUT_task1_2	LiSCUTt1_2	Li2017	63.6	mono	44.1kHz		DNN(MFCC)	Bi-LSTM	majority vote
Li_SCUT_task1_3	LiSCUTt1_3	Li2017	61.7	mono	44.1kHz		DNN(MFCC)	DNN	majority vote
Li_SCUT_task1_4	LiSCUTt1_4	Li2017	57.8	mono	44.1kHz		DNN(MFCC)	Bi-LSTM	majority vote
Maka_ZUT_task1_1	ASAWI	Maka2017	47.5	binaural	44.1kHz		cochleagram, onset map, binaural cues, low-level feature contours	random forest
Mun_KU_task1_1	GAN_SKMUN	Mun2017	83.3	left, right, mixed	22.05kHz	GAN	log-mel energies, spectrogram	MLP, RNN, CNN, SVM	majority vote
Park_ISPL_task1_1	ISPL	Park2017	72.6	binaural	44.1kHz	block mixing	covariance of gammachirp energies, double FFT of gammachirp energies	CNN	maximum posterior
Phan_UniLuebeck_task1_1	CNN	Phan2017	59.0	binaural	44.1kHz	cross-validation with different data splits	generalized label tree embedding	CNN	entire-signal classification
Phan_UniLuebeck_task1_2	ACNN	Phan2017	55.9	binaural	44.1kHz	cross-validation with different data splits	generalized label tree embedding	Attentive CNN	entire-signal classification
Phan_UniLuebeck_task1_3	CNN+	Phan2017	58.3	binaural	44.1kHz	cross-validation with different data splits	generalized label tree embedding	CNN	entire-signal classification
Phan_UniLuebeck_task1_4	ACNN+	Phan2017	58.0	binaural	44.1kHz	cross-validation with different data splits	generalized label tree embedding	Attentive CNN	entire-signal classification
Piczak_WUT_task1_1	amb200	Piczak2017	70.6	mono	44.1kHz	time delay, block mixing	spectrogram	CNN	majority vote
Piczak_WUT_task1_2	dishes	Piczak2017	69.6	mono	44.1kHz	time delay, block mixing	spectrogram	CNN	majority vote
Piczak_WUT_task1_3	amb100	Piczak2017	67.7	mono	44.1kHz	time delay, block mixing	spectrogram	CNN	majority vote
Piczak_WUT_task1_4	amb60	Piczak2017	62.0	mono	44.1kHz	time delay, block mixing	spectrogram	CNN	majority vote
Rakotomamonjy_UROUEN_task1_1	HBGS CNN	Rakotomamonjy2017	61.5	mono	44.1kHz		CQT	CNN	average prediction
Rakotomamonjy_UROUEN_task1_2	HBGS CNN-4	Rakotomamonjy2017	62.7	mono	44.1kHz		CQT	CNN	average prediction over 4 models
Rakotomamonjy_UROUEN_task1_3	HBGS CNN-19	Rakotomamonjy2017	62.8	mono	44.1kHz		CQT	CNN	average prediction over 19 models
Schindler_AIT_task1_1	multires	Schindler2017	61.7	mono	44.1kHz	time stretching, block mixing, pitch shifting, mixing files of same class, gaussian noise	log-mel spectrogram	CNN	argmax of average softmax response per file
Schindler_AIT_task1_2	multires-p	Schindler2017	61.7	mono	44.1kHz	time stretching, block mixing, pitch shifting, mixing files of same class, gaussian noise	log-mel spectrogram	CNN	argmax of average softmax response per file
Vafeiadis_CERTH_task1_1	CERTH_1	Vafeiadis2017	61.0	mono	44.1kHz		MFCC, MFCC delta, MFCC acceleration, centroid, rolloff, ZCR	SVM-HMM	majority vote
Vafeiadis_CERTH_task1_2	CERTH_2	Vafeiadis2017	49.5	mono	44.1kHz	speed and pitch change (downsampling), amplitude change (dynamic), gaussian noise	log-mel spectrogram	CNN	majority vote
Vij_UIET_task1_1	Vij_UIET_1	Vij2017	61.2	binaural	44.1kHz	feature frame concatenation	log mel-filter bank	RNN	majority vote
Vij_UIET_task1_2	Vij_UIET_2	Vij2017	57.5	binaural	44.1kHz	feature frame concatenation	log mel-filter bank	LSTM	majority vote
Vij_UIET_task1_3	Vij_UIET_3	Vij2017	59.6	binaural	44.1kHz	feature frame concatenation	log mel-filter bank	GRU	majority vote
Vij_UIET_task1_4	Vij_UIET_4	Vij2017	65.0	binaural	44.1kHz	feature frame concatenation	log mel-filter bank	CNN	majority vote
Waldekar_IITKGP_task1_1	IITKGP_ABSP_Fusion	Waldekar2017	67.0	binaural	44.1kHz		combination [block-based MFCC; SCFC; CQCC]	SVM	fusion
Waldekar_IITKGP_task1_2	IITKGP_ABSP_Hierarchical	Waldekar2017	64.9	binaural	44.1kHz		combination [block-based MFCC; SCFC; CQCC]	SVM	fusion
Xing_SCNU_task1_1	DCNN_vote	Weiping2017	74.8	binaural	22.05kHz		spectrogram, CQT	CNN	majority vote
Xing_SCNU_task1_2	DCNN_SVM	Weiping2017	77.7	binaural	22.05kHz		spectrogram, CQT	CNN	SVM
Xu_NUDT_task1_1	XuCnnMFCC	Xu2017	68.5	left, right, mixed	44.1kHz	pitch shifting	MFCC, spectrogram	CNN	majority vote
Xu_NUDT_task1_2	XuCnnMFCC	Xu2017	67.5	left, right, mixed	44.1kHz	pitch shifting	MFCC, spectrogram	CNN	majority vote
Xu_PKU_task1_1	autolog1	Xu2017a	65.9	binaural	44.1kHz		CQT	Autoencoder and Logistic Regression	majority vote
Xu_PKU_task1_2	autolog2	Xu2017a	66.7	binaural	44.1kHz		CQT	Autoencoder and Logistic Regression	majority vote
Xu_PKU_task1_3	autolog3	Xu2017a	64.6	binaural	44.1kHz		CQT	Autoencoder and Logistic Regression	majority vote
Yang_WHU_TASK1_1	MFS	Lu2017	61.5	mono	44.1kHz		log-mel energies	CNN	logsum
Yang_WHU_TASK1_2	STD	Lu2017	65.2	mono	44.1kHz		log-mel energies	CNN	logsum
Yang_WHU_TASK1_3	MFS+STD	Lu2017	62.8	mono	44.1kHz		log-mel energies	CNN	logsum
Yang_WHU_TASK1_4	Pre-training	Lu2017	63.6	mono	44.1kHz		log-mel energies	CNN	logsum
Yu_UOS_task1_1	UOS_DualIn	Jee-Weon2017	67.0	left, right, mixed	44.1kHz		mel-filterbank features	MLP, ensemble	score sum
Yu_UOS_task1_2	UOS_BalCos	Jee-Weon2017	66.2	left, right, mixed	44.1kHz		mel-filterbank features	MLP, ensemble	score sum
Yu_UOS_task1_3	UOS_DatDup	Jee-Weon2017	67.3	left, right, mixed	44.1kHz	stochastic duplication	mel-filterbank features	MLP, ensemble	score sum
Yu_UOS_task1_4	UOS_res	Jee-Weon2017	70.6	left, right, mixed	44.1kHz	stochastic duplication	mel-filterbank features	MLP, ensemble	score sum
Zhao_ADSC_task1_1	MResNet-34	Zhao2017	70.0	binaural	44.1kHz		log-mel spectrogram	CNN	majority vote
Zhao_ADSC_task1_2	Conv	Zhao2017	67.9	binaural	44.1kHz		log-mel spectrogram	CNN	majority vote
Zhao_UAU_UP_task1_1	GRNN	Zhao2017a	63.8	mono	44.1kHz		spectrogram, scalogram, wavelets, ComParE (openSMILE)	GRNN	margin sampling value

Technical reports

GMM-AA System for Acoustic Scene Classification

Vinayak Abrol, Pulkit Sharma and Anshul Thakur

Multimedia Analytics and Systems Lab, SCEE, Indian Institute of Technology Mandi, Mandi, India

Abrol_IITM_task1_1

Input	mono
Sampling rate	44.1kHz
Features	CQT
Classifier	GMM, Archetypal Analysis, SVM
Decision making	majority vote on audio segments of a file

Input	binaural; mono, binaural; mono
Sampling rate	22.05kHz
Data augmentation	pitch shifting
Features	MFCC based i-vectors; MFCC, log-scaled spectrogram; log-scaled spectrogram; mel-scaled spectrograms, i-vectors
Classifier	i-vector; CNN, i-vector, ensemble; CNN, ensemble; i-vector, CNN, ensemble
Decision making	min. cosine distance; model averaging; fusion w/ logistic linear regression

Content

Task description

Challenge results

Systems ranking

Teams ranking

Class-wise performance

System characteristics

Technical reports

GMM-AA System for Acoustic Scene Classification

GMM-AA System for Acoustic Scene Classification

Abstract

System characteristics

Sequence to Sequence Autoencoders for Unsupervised Representation Learning From Audio

Sequence to Sequence Autoencoders for Unsupervised Representation Learning From Audio

Abstract

System characteristics

The Combined Augsburg / Passau / Tum / Icl System for DCASE 2017

The Combined Augsburg / Passau / Tum / Icl System for DCASE 2017

Abstract

System characteristics

Nonnegative Feature Learning Methods for Acoustic Scene Classification

Nonnegative Feature Learning Methods for Acoustic Scene Classification

Abstract

System characteristics

Acoustic Scene Classification Using Deep Neural Network

Acoustic Scene Classification Using Deep Neural Network

Abstract

System characteristics

FrameCNN: A Weakly-Supervised Learning Framework for Frame-Wise Acoustic Event Detection and Classification

FrameCNN: A Weakly-Supervised Learning Framework for Frame-Wise Acoustic Event Detection and Classification

Abstract

System characteristics

Deep Learning for DCASE2017 Challenge

Deep Learning for DCASE2017 Challenge

Abstract

System characteristics

Ensemble of Deep Neural Networks for Acoustic Scene Classification

Ensemble of Deep Neural Networks for Acoustic Scene Classification

Abstract

System characteristics

MLP-Based Feature Learning for Automatic Acoustic Scene Classification

MLP-Based Feature Learning for Automatic Acoustic Scene Classification

Abstract

System characteristics

Acoustic Scene Classification by Ensembling Gradient Boosting Machine and Convolutional Neural Networks

Acoustic Scene Classification by Ensembling Gradient Boosting Machine and Convolutional Neural Networks

Abstract

System characteristics

Classification of Acoustic Scenes Based on the Modulation Spectrum

Classification of Acoustic Scenes Based on the Modulation Spectrum

Abstract

System characteristics

Acoustic Scene Classification by Fusing LightGBM and VGG-Net Multichannel Predictions

Acoustic Scene Classification by Fusing LightGBM and VGG-Net Multichannel Predictions

Abstract

System characteristics

Convolutional Neural Networks with Binaural Representations and Background Subtraction for Acoustic Scene Classification

Convolutional Neural Networks with Binaural Representations and Background Subtraction for Acoustic Scene Classification

Abstract

System characteristics

DCASE 2017 Challenge Setup: Tasks, Datasets and Baseline System

DCASE 2017 Challenge Setup: Tasks, Datasets and Baseline System

Abstract

System characteristics

A Multi-Scale Deep Convolutional Neural Network for Acoustic Scene Classification

A Multi-Scale Deep Convolutional Neural Network for Acoustic Scene Classification

Abstract

System characteristics

Improved Acoustic Scene Classification with DNN and CNN

Improved Acoustic Scene Classification with DNN and CNN

Abstract

System characteristics

BUET Bosch Consortium (B2C) Acoustic Scene Classification Systems for DCASE 2017

BUET Bosch Consortium (B2C) Acoustic Scene Classification Systems for DCASE 2017

Abstract

System characteristics

Acoustic Scene Classification Using CRNN

Acoustic Scene Classification Using CRNN

Abstract

System characteristics