Task description

This subtask is concerned with the situation in which an application will be tested with different devices, possibly not the same as the ones used to record the development data. In this case, evaluation data contains more devices than the development data.

The development data consists of the same recordings as in subtask A, and a small amount of parallel data recorded with devices B and C. The amount of data is as follows:

Device A: 40 hours (14400 segments, same as subtask A, but resampled and single-channel)
Device B: 3 hours (108 segments per acoustic scene)
Device C: 3 hours (108 segments per acoustic scene)

More detailed task description can be found in the task description page

Systems ranking

Submission code	Submission name	Technical Report	Accuracy (B/C) with 95% confidence interval (Evaluation dataset)	Accuracy (B/C) (Development dataset)
Eghbal-zadeh_CPJKU_task1b_1	mmd_shake_res_snapi	Eghbal-zadeh2019	74.5 (73.5 - 75.5)
Eghbal-zadeh_CPJKU_task1b_2	mmd_shake_res	Eghbal-zadeh2019	74.5 (73.5 - 75.5)
Eghbal-zadeh_CPJKU_task1b_3	mmd_shake_snapi	Eghbal-zadeh2019	73.4 (72.4 - 74.5)
Eghbal-zadeh_CPJKU_task1b_4	mmd_shake	Eghbal-zadeh2019	73.4 (72.3 - 74.4)
DCASE2019 baseline	Baseline		47.7 (46.5 - 48.8)	41.4
Jiang_UESTC_task1b_1	Randomforest_16	Jiang2019	70.3 (69.2 - 71.3)	62.2
Jiang_UESTC_task1b_2	Randomforest_8	Jiang2019	69.9 (68.9 - 71.0)	64.2
Jiang_UESTC_task1b_3	Averaging_16	Jiang2019	69.0 (68.0 - 70.1)	63.2
Jiang_UESTC_task1b_4	Averaging_8	Jiang2019	69.6 (68.6 - 70.7)	64.0
Kong_SURREY_task1b_1	cvssp_cnn9	Kong2019	61.6 (60.4 - 62.7)	52.7
Kosmider_SRPOL_task1b_1	SC+IC+RCV	Komider2019	75.1 (74.1 - 76.1)
Kosmider_SRPOL_task1b_2	SC+ALL+SV	Komider2019	75.3 (74.3 - 76.3)
Kosmider_SRPOL_task1b_3	SC+IC+RCV	Komider2019	74.9 (73.9 - 75.9)
Kosmider_SRPOL_task1b_4	SC+FULL+SV	Komider2019	75.2 (74.3 - 76.2)
LamPham_KentGroup_task1b_1	Kent	Pham2019	72.8 (71.8 - 73.8)	72.9
McDonnell_USA_task1b_1	UniSA_1b1	Gao2019	74.2 (73.2 - 75.2)	66.3
McDonnell_USA_task1b_2	UniSA_1b2	Gao2019	74.1 (73.1 - 75.2)	62.5
McDonnell_USA_task1b_3	UniSA_1b3	Gao2019	74.9 (73.9 - 75.9)	64.2
McDonnell_USA_task1b_4	UniSA_1b4	Gao2019	74.4 (73.4 - 75.4)	66.3
Primus_CPJKU_task1b_1	CPR-NoDA	Primus2019	71.3 (70.2 - 72.3)	61.2
Primus_CPJKU_task1b_2	CPR-MSE	Primus2019	73.4 (72.4 - 74.4)	64.3
Primus_CPJKU_task1b_3	CPR-MI	Primus2019	71.6 (70.6 - 72.7)	62.5
Primus_CPJKU_task1b_4	CPR-Ensemble	Primus2019	74.2 (73.2 - 75.2)	65.1
Song_HIT_task1b_1	hitsplab_1	Song2019	67.3 (66.2 - 68.3)	65.6
Song_HIT_task1b_2	hitsplab_2	Song2019	72.2 (71.2 - 73.3)	41.4
Song_HIT_task1b_3	hitsplab_3	Song2019	72.1 (71.1 - 73.1)	70.3
Waldekar_IITKGP_task1b_1	IITKGP_MFDWC19	Waldekar2019	62.1 (60.9 - 63.2)	52.3
Wang_NWPU_task1b_1	Rui_task1b	Wang2019	65.7 (64.6 - 66.8)	54.8
Wang_NWPU_task1b_2	Rui_task1b	Wang2019	68.5 (67.4 - 69.6)	55.2
Wang_NWPU_task1b_3	Rui_task1b	Wang2019	70.3 (69.3 - 71.4)	54.8

Teams ranking

Submission code	Submission name	Technical Report	Accuracy with 95% confidence interval (Evaluation dataset)	Accuracy (Development dataset)
Eghbal-zadeh_CPJKU_task1b_2	mmd_shake_res	Eghbal-zadeh2019	74.5 (73.5 - 75.5)
DCASE2019 baseline	Baseline		47.7 (46.5 - 48.8)	41.4
Jiang_UESTC_task1b_1	Randomforest_16	Jiang2019	70.3 (69.2 - 71.3)	62.2
Kong_SURREY_task1b_1	cvssp_cnn9	Kong2019	61.6 (60.4 - 62.7)	52.7
Kosmider_SRPOL_task1b_2	SC+ALL+SV	Komider2019	75.3 (74.3 - 76.3)
LamPham_KentGroup_task1b_1	Kent	Pham2019	72.8 (71.8 - 73.8)	72.9
McDonnell_USA_task1b_3	UniSA_1b3	Gao2019	74.9 (73.9 - 75.9)	64.2
Primus_CPJKU_task1b_4	CPR-Ensemble	Primus2019	74.2 (73.2 - 75.2)	65.1
Song_HIT_task1b_2	hitsplab_2	Song2019	72.2 (71.2 - 73.3)	41.4
Waldekar_IITKGP_task1b_1	IITKGP_MFDWC19	Waldekar2019	62.1 (60.9 - 63.2)	52.3
Wang_NWPU_task1b_3	Rui_task1b	Wang2019	70.3 (69.3 - 71.4)	54.8

Class-wise performance

Submission code	Submission name	Technical Report	Accuracy (Evaluation dataset)	Airport	Bus	Metro	Metro station	Park	Public square	Shopping mall	Street pedestrian	Street traffic	Tram
Eghbal-zadeh_CPJKU_task1b_1	mmd_shake_res_snapi	Eghbal-zadeh2019	74.5	71.2	90.3	74.9	66.0	84.6	59.9	81.8	45.0	89.7	81.5
Eghbal-zadeh_CPJKU_task1b_2	mmd_shake_res	Eghbal-zadeh2019	74.5	70.1	90.6	74.4	66.2	82.1	58.3	82.6	48.1	90.3	82.2
Eghbal-zadeh_CPJKU_task1b_3	mmd_shake_snapi	Eghbal-zadeh2019	73.4	73.6	89.6	71.0	66.1	86.1	56.5	78.8	44.0	87.2	81.4
Eghbal-zadeh_CPJKU_task1b_4	mmd_shake	Eghbal-zadeh2019	73.4	71.7	90.1	72.5	65.1	85.8	58.9	79.3	43.1	88.1	79.0
DCASE2019 baseline	Baseline		47.7	36.5	57.8	57.8	35.8	54.9	15.8	76.8	28.3	67.8	45.1
Jiang_UESTC_task1b_1	Randomforest_16	Jiang2019	70.3	61.3	68.2	76.7	71.9	79.6	59.4	80.7	47.5	86.8	70.7
Jiang_UESTC_task1b_2	Randomforest_8	Jiang2019	69.9	62.6	69.2	74.0	71.7	79.0	58.9	79.3	46.5	87.4	70.8
Jiang_UESTC_task1b_3	Averaging_16	Jiang2019	69.0	54.7	67.1	74.9	71.1	80.7	61.9	85.3	39.7	89.2	65.8
Jiang_UESTC_task1b_4	Averaging_8	Jiang2019	69.6	54.2	71.2	71.9	70.8	80.3	62.4	84.9	40.0	89.6	71.0
Kong_SURREY_task1b_1	cvssp_cnn9	Kong2019	61.6	50.4	63.7	69.7	52.2	77.4	41.1	56.8	60.7	84.3	59.2
Kosmider_SRPOL_task1b_1	SC+IC+RCV	Komider2019	75.1	64.0	82.4	78.6	65.0	92.1	62.4	85.0	49.3	87.4	84.6
Kosmider_SRPOL_task1b_2	SC+ALL+SV	Komider2019	75.3	68.3	85.8	81.2	65.6	94.3	53.6	86.4	45.1	90.1	82.4
Kosmider_SRPOL_task1b_3	SC+IC+RCV	Komider2019	74.9	64.0	82.2	79.0	65.4	92.2	61.1	84.4	49.0	86.8	84.4
Kosmider_SRPOL_task1b_4	SC+FULL+SV	Komider2019	75.2	67.9	85.8	80.8	65.0	94.4	54.7	86.4	43.2	89.9	84.3
LamPham_KentGroup_task1b_1	Kent	Pham2019	72.8	69.9	91.9	66.1	56.7	87.6	44.9	73.3	64.3	89.6	83.9
McDonnell_USA_task1b_1	UniSA_1b1	Gao2019	74.2	68.9	88.1	77.1	67.4	84.3	55.6	85.3	49.3	91.9	73.9
McDonnell_USA_task1b_2	UniSA_1b2	Gao2019	74.1	73.9	87.5	73.6	70.0	81.5	55.6	82.2	52.8	91.1	73.2
McDonnell_USA_task1b_3	UniSA_1b3	Gao2019	74.9	72.1	88.6	75.4	70.1	83.8	56.2	84.0	52.5	92.1	74.2
McDonnell_USA_task1b_4	UniSA_1b4	Gao2019	74.4	70.4	86.8	77.8	69.2	83.1	55.0	86.8	49.6	92.1	73.5
Primus_CPJKU_task1b_1	CPR-NoDA	Primus2019	71.3	78.8	86.0	66.7	64.0	79.3	51.2	74.4	40.7	90.0	81.8
Primus_CPJKU_task1b_2	CPR-MSE	Primus2019	73.4	75.4	86.1	71.9	71.7	87.8	57.1	74.6	36.0	91.0	82.2
Primus_CPJKU_task1b_3	CPR-MI	Primus2019	71.6	76.1	83.1	76.0	61.8	78.8	59.3	70.3	36.4	91.1	83.3
Primus_CPJKU_task1b_4	CPR-Ensemble	Primus2019	74.2	77.5	86.2	74.4	72.4	86.4	59.9	78.1	36.0	89.9	81.5
Song_HIT_task1b_1	hitsplab_1	Song2019	67.3	41.4	74.9	59.2	70.0	86.8	45.0	86.2	46.1	88.2	74.9
Song_HIT_task1b_2	hitsplab_2	Song2019	72.2	63.1	80.6	76.5	73.5	86.9	37.8	87.5	51.5	92.5	72.6
Song_HIT_task1b_3	hitsplab_3	Song2019	72.1	56.2	82.1	70.7	74.3	87.2	40.3	86.9	51.1	93.2	79.0
Waldekar_IITKGP_task1b_1	IITKGP_MFDWC19	Waldekar2019	62.1	55.6	69.7	55.0	51.8	83.8	43.2	66.2	42.4	86.2	66.7
Wang_NWPU_task1b_1	Rui_task1b	Wang2019	65.7	55.7	68.2	69.7	60.0	81.8	45.3	62.6	55.6	90.3	67.6
Wang_NWPU_task1b_2	Rui_task1b	Wang2019	68.5	58.8	70.1	71.5	64.3	82.1	51.9	68.6	53.1	89.7	74.9
Wang_NWPU_task1b_3	Rui_task1b	Wang2019	70.3	60.3	72.6	72.8	65.8	81.1	54.4	73.2	53.3	90.6	78.9

Device-wise performance

Rank	Submission code	Submission name	Technical Report	Accuracy / Evaluation dataset
Rank	Submission code	Submission name	Technical Report	Average Dev B / Dev C	Dev B	Dev C	Dev A	Dev D
	Eghbal-zadeh_CPJKU_task1b_1	mmd_shake_res_snapi	Eghbal-zadeh2019	74.5	73.8	75.2	81.3	54.4
	Eghbal-zadeh_CPJKU_task1b_2	mmd_shake_res	Eghbal-zadeh2019	74.5	74.0	75.0	81.2	53.1
	Eghbal-zadeh_CPJKU_task1b_3	mmd_shake_snapi	Eghbal-zadeh2019	73.4	72.8	74.1	80.3	55.3
	Eghbal-zadeh_CPJKU_task1b_4	mmd_shake	Eghbal-zadeh2019	73.4	72.6	74.2	79.9	55.5
	DCASE2019 baseline	Baseline		47.7	48.9	46.4	63.2	26.7
	Jiang_UESTC_task1b_1	Randomforest_16	Jiang2019	70.3	69.1	71.4	75.1	53.0
	Jiang_UESTC_task1b_2	Randomforest_8	Jiang2019	69.9	68.5	71.4	75.1	52.0
	Jiang_UESTC_task1b_3	Averaging_16	Jiang2019	69.0	68.4	69.6	74.3	53.2
	Jiang_UESTC_task1b_4	Averaging_8	Jiang2019	69.6	68.8	70.5	73.9	54.2
	Kong_SURREY_task1b_1	cvssp_cnn9	Kong2019	61.6	60.3	62.8	70.2	40.8
	Kosmider_SRPOL_task1b_1	SC+IC+RCV	Komider2019	75.1	74.5	75.7	79.8	36.1
	Kosmider_SRPOL_task1b_2	SC+ALL+SV	Komider2019	75.3	74.3	76.2	80.8	38.6
	Kosmider_SRPOL_task1b_3	SC+IC+RCV	Komider2019	74.9	74.4	75.3	78.9	35.5
	Kosmider_SRPOL_task1b_4	SC+FULL+SV	Komider2019	75.2	74.3	76.2	80.1	40.0
	LamPham_KentGroup_task1b_1	Kent	Pham2019	72.8	71.8	73.8	78.2	24.6
	McDonnell_USA_task1b_1	UniSA_1b1	Gao2019	74.2	73.2	75.1	79.3	63.4
	McDonnell_USA_task1b_2	UniSA_1b2	Gao2019	74.1	73.6	74.7	79.9	63.8
	McDonnell_USA_task1b_3	UniSA_1b3	Gao2019	74.9	74.2	75.6	79.8	65.2
	McDonnell_USA_task1b_4	UniSA_1b4	Gao2019	74.4	73.8	75.1	80.1	63.6
	Primus_CPJKU_task1b_1	CPR-NoDA	Primus2019	71.3	70.9	71.7	78.1	49.4
	Primus_CPJKU_task1b_2	CPR-MSE	Primus2019	73.4	73.6	73.1	72.1	47.9
	Primus_CPJKU_task1b_3	CPR-MI	Primus2019	71.6	71.4	71.8	72.8	49.3
	Primus_CPJKU_task1b_4	CPR-Ensemble	Primus2019	74.2	74.1	74.3	73.7	47.4
	Song_HIT_task1b_1	hitsplab_1	Song2019	67.3	65.3	69.2	73.1	47.7
	Song_HIT_task1b_2	hitsplab_2	Song2019	72.2	71.7	72.8	79.9	59.4
	Song_HIT_task1b_3	hitsplab_3	Song2019	72.1	71.1	73.1	78.4	59.1
	Waldekar_IITKGP_task1b_1	IITKGP_MFDWC19	Waldekar2019	62.1	59.7	64.4	71.4	39.8
	Wang_NWPU_task1b_1	Rui_task1b	Wang2019	65.7	64.9	66.4	75.4	39.9
	Wang_NWPU_task1b_2	Rui_task1b	Wang2019	68.5	67.8	69.2	76.9	46.8
	Wang_NWPU_task1b_3	Rui_task1b	Wang2019	70.3	68.8	71.9	79.6	47.2

System characteristics

General characteristics

Code	Technical Report	Accuracy (Eval)	Sampling rate	Data augmentation	Features
Eghbal-zadeh_CPJKU_task1b_1	Eghbal-zadeh2019	74.5	22.05kHz	mixup	perceptual weighted power spectrogram
Eghbal-zadeh_CPJKU_task1b_2	Eghbal-zadeh2019	74.5	22.05kHz	mixup	perceptual weighted power spectrogram
Eghbal-zadeh_CPJKU_task1b_3	Eghbal-zadeh2019	73.4	22.05kHz	mixup	perceptual weighted power spectrogram
Eghbal-zadeh_CPJKU_task1b_4	Eghbal-zadeh2019	73.4	22.05kHz	mixup	perceptual weighted power spectrogram
DCASE2019 baseline		47.7	44.1kHz		log-mel energies
Jiang_UESTC_task1b_1	Jiang2019	70.3	44.1kHz	HPSS, NNF, vocal separation, HRTF	log-mel energies
Jiang_UESTC_task1b_2	Jiang2019	69.9	44.1kHz	HPSS, NNF, vocal separation, HRTF	log-mel energies
Jiang_UESTC_task1b_3	Jiang2019	69.0	44.1kHz	HPSS, NNF, vocal separation, HRTF	log-mel energies
Jiang_UESTC_task1b_4	Jiang2019	69.6	44.1kHz	HPSS, NNF, vocal separation, HRTF	log-mel energies
Kong_SURREY_task1b_1	Kong2019	61.6	32kHz		log-mel energies
Kosmider_SRPOL_task1b_1	Komider2019	75.1	44.1kHz	Spectrum Correction, SpecAugment, mixup	log-mel energies
Kosmider_SRPOL_task1b_2	Komider2019	75.3	44.1kHz	Spectrum Correction, SpecAugment, mixup	log-mel energies
Kosmider_SRPOL_task1b_3	Komider2019	74.9	44.1kHz	Spectrum Correction, SpecAugment, mixup	log-mel energies
Kosmider_SRPOL_task1b_4	Komider2019	75.2	44.1kHz	Spectrum Correction, SpecAugment, mixup	log-mel energies
LamPham_KentGroup_task1b_1	Pham2019	72.8	44.1kHz	mixup	Gammatone, log-mel energies, CQT
McDonnell_USA_task1b_1	Gao2019	74.2	44.1kHz	mixup, temporal cropping	log-mel energies, deltas and delta-deltas
McDonnell_USA_task1b_2	Gao2019	74.1	44.1kHz	mixup, temporal cropping	log-mel energies
McDonnell_USA_task1b_3	Gao2019	74.9	44.1kHz	mixup, temporal cropping	log-mel energies, deltas and delta-deltas
McDonnell_USA_task1b_4	Gao2019	74.4	44.1kHz	mixup, temporal cropping	log-mel energies, deltas and delta-deltas
Primus_CPJKU_task1b_1	Primus2019	71.3	22.05kHz	mixup	log-mel energies
Primus_CPJKU_task1b_2	Primus2019	73.4	22.05kHz	mixup	log-mel energies
Primus_CPJKU_task1b_3	Primus2019	71.6	22.05kHz	mixup	log-mel energies
Primus_CPJKU_task1b_4	Primus2019	74.2	22.05kHz	mixup	log-mel energies
Song_HIT_task1b_1	Song2019	67.3	44.1kHz	mixup	log-mel energies
Song_HIT_task1b_2	Song2019	72.2	44.1kHz	mixup	log-mel energies
Song_HIT_task1b_3	Song2019	72.1	44.1kHz	mixup	log-mel energies
Waldekar_IITKGP_task1b_1	Waldekar2019	62.1	44.1kHz		MFDWC
Wang_NWPU_task1b_1	Wang2019	65.7	44.1kHz		log-mel energies
Wang_NWPU_task1b_2	Wang2019	68.5	32kHz		log-mel energies
Wang_NWPU_task1b_3	Wang2019	70.3	32kHz		log-mel energies

Machine learning characteristics

Code	Technical Report	Accuracy (Eval)	Model complexity	Classifier	Ensemble subsystems	Decision making	Device mismatch handling
Eghbal-zadeh_CPJKU_task1b_1	Eghbal-zadeh2019	74.5	747596080	CNN, Receptive Field Regularization	220	average	maximum mean discrepancy, domain adaptation, transfer learning
Eghbal-zadeh_CPJKU_task1b_2	Eghbal-zadeh2019	74.5	37379804	CNN, Receptive Field Regularization	11	average	maximum mean discrepancy, domain adaptation, transfer learning
Eghbal-zadeh_CPJKU_task1b_3	Eghbal-zadeh2019	73.4	286137920	CNN, Receptive Field Regularization	80	average	maximum mean discrepancy, domain adaptation, transfer learning
Eghbal-zadeh_CPJKU_task1b_4	Eghbal-zadeh2019	73.4	12878416	CNN, Receptive Field Regularization	4	average	maximum mean discrepancy, domain adaptation, transfer learning
DCASE2019 baseline		47.7	116118	CNN
Jiang_UESTC_task1b_1	Jiang2019	70.3	1448794	CNN	16	stacking
Jiang_UESTC_task1b_2	Jiang2019	69.9	1448794	CNN	8	stacking
Jiang_UESTC_task1b_3	Jiang2019	69.0	1448794	CNN	16	averaging
Jiang_UESTC_task1b_4	Jiang2019	69.6	1448794	CNN	8	averaging
Kong_SURREY_task1b_1	Kong2019	61.6	4686144	CNN
Kosmider_SRPOL_task1b_1	Komider2019	75.1	6100840	CNN	36	isotonic-calibrated soft-voting	spectrum correction
Kosmider_SRPOL_task1b_2	Komider2019	75.3	18095576	CNN	124	soft-voting	spectrum correction
Kosmider_SRPOL_task1b_3	Komider2019	74.9	3077046	CNN	31	soft-voting	spectrum correction
Kosmider_SRPOL_task1b_4	Komider2019	75.2	10768964	CNN	58	soft-voting	spectrum correction
LamPham_KentGroup_task1b_1	Pham2019	72.8	12346325	CNN, DNN	2
McDonnell_USA_task1b_1	Gao2019	74.2	3253148	CNN			aggressive regularization and augmentation
McDonnell_USA_task1b_2	Gao2019	74.1	3252268	CNN			aggressive regularization and augmentation
McDonnell_USA_task1b_3	Gao2019	74.9	6505416	CNN	2	average	aggressive regularization and augmentation
McDonnell_USA_task1b_4	Gao2019	74.4	6506296	CNN	2	average	aggressive regularization and augmentation
Primus_CPJKU_task1b_1	Primus2019	71.3	13047888	CNN, ensemble	4	average
Primus_CPJKU_task1b_2	Primus2019	73.4	13047888	CNN, ensemble	4	average	domain adaptation
Primus_CPJKU_task1b_3	Primus2019	71.6	13047888	CNN, ensemble	8	average	domain adaptation
Primus_CPJKU_task1b_4	Primus2019	74.2	26095776	CNN, ensemble	8	average	domain adaptation
Song_HIT_task1b_1	Song2019	67.3	22758197	CNN			feature transform
Song_HIT_task1b_2	Song2019	72.2	68274591	CNN	3	probability aggregation	feature transform
Song_HIT_task1b_3	Song2019	72.1	68274591	CNN	3	majority vote	feature transform
Waldekar_IITKGP_task1b_1	Waldekar2019	62.1	9000	SVM
Wang_NWPU_task1b_1	Wang2019	65.7	116118	CNN, DNN	7		domain adaptation
Wang_NWPU_task1b_2	Wang2019	68.5	116118	CNN, DNN	7	average	domain adaptation
Wang_NWPU_task1b_3	Wang2019	70.3	116118	CNN, DNN	7	average	domain adaptation

Public leaderboard

Scores

Date	Top Team	Top 10 Team median
2019-05-14	64.8	64.8 (64.8 - 64.8)
2019-05-15	64.8	62.4 (60.0 - 64.8)
2019-05-16	66.3	65.6 (64.8 - 66.3)
2019-05-17	66.7	65.8 (64.8 - 66.7)
2019-05-18	66.7	64.8 (60.5 - 66.7)
2019-05-19	68.5	66.7 (64.8 - 68.5)
2019-05-20	73.3	67.8 (64.8 - 73.3)
2019-05-21	73.3	64.8 (56.7 - 73.3)
2019-05-22	73.3	67.8 (59.3 - 73.3)
2019-05-23	73.3	66.3 (53.2 - 73.3)
2019-05-24	73.3	66.3 (58.3 - 73.3)
2019-05-25	73.3	66.3 (60.3 - 73.3)
2019-05-26	73.3	66.3 (60.3 - 73.3)
2019-05-27	73.3	66.3 (60.3 - 73.3)
2019-05-28	73.3	66.3 (60.7 - 73.3)
2019-05-29	73.3	68.2 (60.7 - 73.3)
2019-05-30	73.3	66.3 (44.0 - 73.3)
2019-05-31	73.3	66.9 (58.3 - 73.3)
2019-06-01	73.3	68.2 (62.5 - 73.3)
2019-06-02	73.7	68.2 (62.5 - 73.7)
2019-06-03	73.7	69.0 (62.5 - 73.7)
2019-06-04	73.7	69.0 (62.5 - 73.7)
2019-06-05	76.5	69.7 (64.8 - 76.5)
2019-06-06	76.5	69.7 (66.7 - 76.5)
2019-06-07	76.5	69.7 (66.7 - 76.5)
2019-06-08	76.5	69.7 (67.7 - 76.5)
2019-06-09	76.5	69.7 (68.3 - 76.5)
2019-06-10	76.5	70.4 (69.0 - 76.5)

Entries

Total entries

Date	Entries
2019-05-14	1
2019-05-15	2
2019-05-16	3
2019-05-17	4
2019-05-18	6
2019-05-19	7
2019-05-20	9
2019-05-21	11
2019-05-22	13
2019-05-23	16
2019-05-24	19
2019-05-25	21
2019-05-26	21
2019-05-27	22
2019-05-28	23
2019-05-29	27
2019-05-30	32
2019-05-31	39
2019-06-01	44
2019-06-02	49
2019-06-03	53
2019-06-04	56
2019-06-05	63
2019-06-06	67
2019-06-07	74
2019-06-08	80
2019-06-09	88
2019-06-10	97

Entries per day

Date	Entries per day
2019-05-14	1
2019-05-15	1
2019-05-16	1
2019-05-17	1
2019-05-18	2
2019-05-19	1
2019-05-20	2
2019-05-21	2
2019-05-22	2
2019-05-23	3
2019-05-24	3
2019-05-25	2
2019-05-26	0
2019-05-27	1
2019-05-28	1
2019-05-29	4
2019-05-30	5
2019-05-31	7
2019-06-01	5
2019-06-02	5
2019-06-03	4
2019-06-04	3
2019-06-05	7
2019-06-06	4
2019-06-07	7
2019-06-08	6
2019-06-09	8
2019-06-10	9

Technical reports

Urban Acoustic Scene Classification Using Binaural Wavelet Scattering and Random Subspace Discrimination Method

Fateme Arabnezhad and Babak Nasersharif

Computer Engineering Department, Khaje Nasir Toosi, Tehran, Iran

Fmta91_KNToosi_task1a_1

Input	mono
Sampling rate	48kHz
Features	wavelet scattering spectra
Classifier	random subspace
Decision making	highest average score

Input	binaural, difference
Sampling rate	48kHz
Data augmentation	mixup
Features	log-mel energies
Classifier	CNN
Decision making	MLP

Input	binaural
Sampling rate	48kHz
Data augmentation	generative neural network; generative neural network, variational autoencoder
Features	log-mel energies, CQT
Classifier	CNN
Decision making	average vote

Input	mono; mono, left, right, mixed
Sampling rate	48kHz
Features	log-mel energies; MFCC, log-mel energies, ZRC, RMSE, spectrogram centroid
Classifier	GMM; GMM, CNN
Decision making	majority vote

Input	mixed
Sampling rate	48kHz
Data augmentation	DCGAN
Features	log-mel energies
Classifier	CNN
Decision making	majority vote

Input	left, right; mono
Sampling rate	48kHz; 44.1kHz
Data augmentation	mixup, temporal cropping
Features	log-mel energies, deltas and delta-deltas; log-mel energies
Classifier	CNN
Decision making	average

Input	mono, binaural
Sampling rate	44.1kHz
Data augmentation	mixup
Features	log-mel energies
Classifier	CNN
Decision making	average; random forest

Input	mono; mono , binaural; binaural
Sampling rate	16kHz; 48kHz, 16kHz; 48kHz
Data augmentation	mixup
Features	raw waveform, log-mel energies; log-mel energies
Classifier	CNN
Decision making	Max value of soft ensemble

Input	left, right, mixed
Sampling rate	44.1kHz
Data augmentation	mixup
Features	MFCC, CQT
Classifier	CNN
Decision making	majority vote

Input	left,right
Sampling rate	48kHz
Features	DSS
Classifier	CNN,DNN

Input	mono, left, right, mid, side
Sampling rate	48kHz
Data augmentation	mixup
Features	log-mel energies
Classifier	CNN
Decision making	max probability

Input	mono,binaural
Sampling rate	48kHz
Data augmentation	mixup
Features	log-mel energies
Classifier	ResNet
Decision making	vote

Input	mono, left, right, difference, harmonic, percussive
Sampling rate	48kHz
Features	log-mel energies
Classifier	ensemble, CNN
Decision making	arithmetic mean; geometric mean; orness weighted average

Input	mono, left, right
Sampling rate	48kHz
Data augmentation	mixup
Features	log-mel energies, harmonic, percussive
Classifier	CNN, random forest; CNN
Decision making	random forest; majority vote

Input	binaural; mono
Sampling rate	22.05kHz; 16kHz
Data augmentation	SpecAugment, RandomCrop; Between-Class learning; SpecAugment, RandomCrop, Between-Class learning
Features	log-mel energies; raw waveform
Classifier	CNN

Input	multiple
Sampling rate	48kHz
Data augmentation	mixup
Features	log-mel energies
Classifier	CNN, BGRU, self-attention, ensemble

Content

Task description

Systems ranking

Teams ranking

Class-wise performance

Device-wise performance

System characteristics

General characteristics

Machine learning characteristics

Public leaderboard

Scores

Entries

Total entries

Entries per day

Technical reports

Urban Acoustic Scene Classification Using Binaural Wavelet Scattering and Random Subspace Discrimination Method

Urban Acoustic Scene Classification Using Binaural Wavelet Scattering and Random Subspace Discrimination Method

Abstract

System characteristics

Acoustic Scene Classification with Multiple Instance Learning and Fusion

Acoustic Scene Classification with Multiple Instance Learning and Fusion

Abstract

System characteristics

Integrating the Data Augmentation Scheme with Various Classifiers for Acoustic Scene Modeling

Integrating the Data Augmentation Scheme with Various Classifiers for Acoustic Scene Modeling

Abstract

System characteristics

Acoustic Scene Classification Based on Ensemble System

Acoustic Scene Classification Based on Ensemble System

Abstract

System characteristics

Acoustic Scene Classification and Audio Tagging with Receptive-Field-Regularized CNNs

Acoustic Scene Classification and Audio Tagging with Receptive-Field-Regularized CNNs

Abstract

System characteristics

Acoustic Scene Classification Based on the Dataset with Deep Convolutional Generated Against Network

Acoustic Scene Classification Based on the Dataset with Deep Convolutional Generated Against Network

Abstract

System characteristics

Classification of Acoustic Scenes Based on Modulation Spectra and Position-Pitch Maps

Classification of Acoustic Scenes Based on Modulation Spectra and Position-Pitch Maps

Abstract

System characteristics

Acoustic Scene Classification Using Deep Residual Networks with Late Fusion of Separated High and Low Frequency Paths

Acoustic Scene Classification Using Deep Residual Networks with Late Fusion of Separated High and Low Frequency Paths

Abstract

System characteristics

Acoustic Scene Classification Using CNN Ensembles and Primary Ambient Extraction

Acoustic Scene Classification Using CNN Ensembles and Primary Ambient Extraction

Abstract

System characteristics

Acoustic Scene Classification Using Deep Learning-Based Ensemble Averaging

Acoustic Scene Classification Using Deep Learning-Based Ensemble Averaging

Abstract

System characteristics

Acoustic Scene Classification Based on Deep Convolutional Neuralnetwork with Spatial-Temporal Attention Pooling

Acoustic Scene Classification Based on Deep Convolutional Neuralnetwork with Spatial-Temporal Attention Pooling

Abstract

System characteristics

Acoustic Scene Classification Using Various Pre-Processed Features and Convolutional Neural Networks

Acoustic Scene Classification Using Various Pre-Processed Features and Convolutional Neural Networks

Abstract

System characteristics

Acoustic Scene Classification Using Ensembles of Convolutional Neural Networks and Spectrogram Decompositions

Acoustic Scene Classification Using Ensembles of Convolutional Neural Networks and Spectrogram Decompositions

Abstract

System characteristics

Knowledge Distillation with Specialist Models in Acoustic Scene Classification

Knowledge Distillation with Specialist Models in Acoustic Scene Classification

Abstract

System characteristics

The I2r Submission to DCASE 2019 Challenge

The I2r Submission to DCASE 2019 Challenge

Abstract

System characteristics

Calibrating Neural Networks for Secondary Recording Devices

Calibrating Neural Networks for Secondary Recording Devices

Abstract

System characteristics

Cross-Task Learning for Audio Tagging, Sound Event Detection and Spatial Localization: DCASE 2019 Baseline Systems