Task description

The task evaluates systems for the large-scale detection of sound events using weakly labeled data (without timestamps). The target of the systems is to provide not only the event class but also the event time boundaries given that multiple events can be present in an audio recording. Another challenge of the task is to explore the possibility to exploit a large amount of unbalanced and unlabeled training data together with a small weakly annotated training set to improve system performance. The labels in the annotated subset are verified and can be considered as reliable.

More detailed task description can be found in the task description page

Systems ranking

Submission code	Submission name	Technical Report	Event-based F-score (Evaluation dataset)	Event-based F-score (Development dataset)
Avdeeva_ITMO_task4_1	PPF_system	Avdveeva2018	20.1	28.1
Avdeeva_ITMO_task4_2	PPF_system	Avdveeva2018	19.5	28.1
Wang_NUDT_task4_1	NUDT-System	WangD2018	12.4	22.1
Wang_NUDT_task4_2	NUDT-System	WangD2018	12.6	22.0
Wang_NUDT_task4_3	NUDT-System	WangD2018	12.0	20.5
Wang_NUDT_task4_4	NUDT-System	WangD2018	12.2	20.1
Dinkel_SJTU_task4_1	SJTU-ASR-GRU	Dinkel2018	10.4	13.4
Dinkel_SJTU_task4_2	SJTU-ASR-CRNN	Dinkel2018	10.7	13.7
Dinkel_SJTU_task4_3	SJTU-ASR-GAUSS	Dinkel2018	13.4	19.4
Dinkel_SJTU_task4_4	SJTU-CRNN	Dinkel2018	11.2	14.9
Guo_THU_task4_1	THU_multiCRNN	Guo2018	21.3	29.2
Guo_THU_task4_2	THU_multiCRNN	Guo2018	20.6	29.2
Guo_THU_task4_3	THU_multiCRNN	Guo2018	19.1	29.2
Guo_THU_task4_4	THU_multiCRNN	Guo2018	19.0	29.2
Harb_TUG_task4_1	Harb_TUG	Harb2018	19.4	34.6
Harb_TUG_task4_2	Harb_TUG	Harb2018	15.7	34.6
Harb_TUG_task4_3	Harb_TUG	Harb2018	21.6	34.6
Hou_BUPT_task4_1	Hou_BUPT_1	Hou2018	19.6	32.7
Hou_BUPT_task4_2	Hou_BUPT_2	Hou2018	18.9	30.8
Hou_BUPT_task4_3	Hou_BUPT_3	Hou2018	20.9	33.0
Hou_BUPT_task4_4	Hou_BUPT_4	Hou2018	21.1	31.5
CANCES_IRIT_task4_1	IRIT_WGRU_GRU_fusion	Cances2018	8.4	16.3
PELLEGRINI_IRIT_task4_2	IRIT_MIL	Cances2018	16.6	24.6
Kothinti_JHU_task4_1	JHU_T4	Kothinti2018	20.6	29.3
Kothinti_JHU_task4_2	JHU_T4	Kothinti2018	20.9	29.8
Kothinti_JHU_task4_3	JHU_T4	Kothinti2018	20.9	24.5
Kothinti_JHU_task4_4	JHU_T4	Kothinti2018	22.4	30.1
Koutini_JKU_task4_1	JKU_rcnn_threshold	Koutini2018	21.5	40.9
Koutini_JKU_task4_2	JKU_rcnn_prec	Koutini2018	21.1	40.2
Koutini_JKU_task4_3	JKU_rcnn_prec2	Koutini2018	20.6	40.2
Koutini_JKU_task4_4	JKU_rcnn_uth	Koutini2018	18.8	35.6
Liu_USTC_task4_1	USTC_NEL1	Liu2018	27.3	42.4
Liu_USTC_task4_2	USTC_NEL2	Liu2018	28.8	47.4
Liu_USTC_task4_3	USTC_NEL3	Liu2018	28.1	50.3
Liu_USTC_task4_4	USTC_NEL4	Liu2018	29.9	51.6
LJK_PSH_task4_1	LJK_PSH_task4_1	Lu2018	24.1	28.6
LJK_PSH_task4_2	LJK_PSH_task4_2	Lu2018	26.3	26.4
LJK_PSH_task4_3	LJK_PSH_task4_3	Lu2018	29.5	27.2
LJK_PSH_task4_4	LJK_PSH_task4_4	Lu2018	32.4	25.9
Moon_YONSEI_task4_1	Yonsei_str_1	Moon2018	15.9	21.6
Moon_YONSEI_task4_2	Yonsei_str_2	Moon2018	14.3	24.3
Raj_IITKGP_task4_1	Raj_IIT_KGP_Task4_1	Raj2018	9.4	21.9
Lim_ETRI_task4_1	Lim_task4_1	Lim2018	17.1	21.9
Lim_ETRI_task4_2	Lim_task4_2	Lim2018	18.0	23.1
Lim_ETRI_task4_3	Lim_task4_3	Lim2018	19.6	28.4
Lim_ETRI_task4_4	Lim_task4_4	Lim2018	20.4	29.3
WangJun_BUPT_task4_2	BUPT_Attention	WangJ2018	17.9	27.0
DCASE2018 baseline	Baseline	Serizel2018	10.8	14.1
Baseline_Surrey_task4_1	SurreyCNN8	Kong2018	18.6	20.8
Baseline_Surrey_task4_2	SurreyCNN4	Kong2018	16.7	20.8
Baseline_Surrey_task4_3	SurreyFuse	Kong2018	24.0	26.7

Teams ranking

Table including only the best performing system per submitting team.

Submission code	Submission name	Technical Report	Event-based F-score (Evaluation dataset)	Event-based F-score (Development dataset)
Avdeeva_ITMO_task4_1	PPF_system	Avdveeva2018	20.1	28.1
Wang_NUDT_task4_2	NUDT-System	WangD2018	12.6	22.0
Dinkel_SJTU_task4_3	SJTU-ASR-GAUSS	Dinkel2018	13.4	19.4
Guo_THU_task4_1	THU_multiCRNN	Guo2018	21.3	29.2
Harb_TUG_task4_3	Harb_TUG	Harb2018	21.6	34.6
Hou_BUPT_task4_4	Hou_BUPT_4	Hou2018	21.1	31.5
PELLEGRINI_IRIT_task4_2	IRIT_MIL	Cances2018	16.6	24.6
Kothinti_JHU_task4_4	JHU_T4	Kothinti2018	22.4	30.1
Koutini_JKU_task4_1	JKU_rcnn_threshold	Koutini2018	21.5	40.9
Liu_USTC_task4_4	USTC_NEL4	Liu2018	29.9	51.6
LJK_PSH_task4_4	LJK_PSH_task4_4	Lu2018	32.4	25.9
Moon_YONSEI_task4_1	Yonsei_str_1	Moon2018	15.9	21.6
Raj_IITKGP_task4_1	Raj_IIT_KGP_Task4_1	Raj2018	9.4	21.9
Lim_ETRI_task4_4	Lim_task4_4	Lim2018	20.4	29.3
WangJun_BUPT_task4_2	BUPT_Attention	WangJ2018	17.9	27.0
DCASE2018 baseline	Baseline	Serizel2018	10.8	14.1
Baseline_Surrey_task4_3	SurreyFuse	Kong2018	24.0	26.7

Class-wise performance

Submission code	Submission name	Technical Report	Event-based F-score (Evaluation dataset)	Alarm Bell Ringing	Blender	Cat	Dishes	Dog	Electric shave toothbrush	Frying	Running water	Speech	Vacuum cleaner
Avdeeva_ITMO_task4_1	PPF_system	Avdveeva2018	20.1	33.3	15.2	14.9	6.3	16.3	15.8	24.6	13.3	27.2	34.8
Avdeeva_ITMO_task4_2	PPF_system	Avdveeva2018	19.5	33.3	11.8	14.9	6.3	16.3	13.1	24.6	13.3	27.2	34.7
Wang_NUDT_task4_1	NUDT-System	WangD2018	12.4	6.8	14.1	2.6	0.8	2.7	29.3	20.2	11.2	1.3	35.0
Wang_NUDT_task4_2	NUDT-System	WangD2018	12.6	6.7	14.4	2.5	1.1	2.6	29.7	22.0	11.1	1.3	34.0
Wang_NUDT_task4_3	NUDT-System	WangD2018	12.0	7.2	17.8	4.2	2.3	3.0	26.2	13.7	10.0	2.7	32.5
Wang_NUDT_task4_4	NUDT-System	WangD2018	12.2	7.0	18.2	3.6	2.7	3.1	27.2	13.9	10.1	2.8	33.1
Dinkel_SJTU_task4_1	SJTU-ASR-GRU	Dinkel2018	10.4	12.2	17.1	2.0	2.7	5.4	12.2	0.0	6.0	23.7	22.6
Dinkel_SJTU_task4_2	SJTU-ASR-CRNN	Dinkel2018	10.7	12.9	15.9	0.6	4.4	5.3	7.5	0.0	9.9	30.6	20.0
Dinkel_SJTU_task4_3	SJTU-ASR-GAUSS	Dinkel2018	13.4	20.2	19.0	0.0	14.1	11.3	9.7	0.0	3.9	39.7	16.0
Dinkel_SJTU_task4_4	SJTU-CRNN	Dinkel2018	11.2	12.7	22.6	0.0	6.1	5.1	11.3	0.0	3.3	31.1	19.6
Guo_THU_task4_1	THU_multiCRNN	Guo2018	21.3	35.3	31.8	7.8	4.0	9.9	17.4	32.7	18.3	31.0	24.8
Guo_THU_task4_2	THU_multiCRNN	Guo2018	20.6	35.3	19.9	6.6	4.4	10.6	13.6	36.8	13.5	35.4	29.4
Guo_THU_task4_3	THU_multiCRNN	Guo2018	19.1	16.7	12.7	6.0	10.7	14.1	12.8	22.1	19.2	36.2	40.8
Guo_THU_task4_4	THU_multiCRNN	Guo2018	19.0	16.5	11.8	7.0	11.3	15.1	14.2	19.9	16.8	37.9	39.2
Harb_TUG_task4_1	Harb_TUG	Harb2018	19.4	21.6	23.7	6.6	0.4	4.8	26.4	34.8	18.1	33.0	25.0
Harb_TUG_task4_2	Harb_TUG	Harb2018	15.7	14.6	20.0	7.2	15.0	10.0	9.1	14.8	13.5	33.7	19.2
Harb_TUG_task4_3	Harb_TUG	Harb2018	21.6	15.4	30.0	8.1	17.5	9.7	21.0	34.7	17.3	31.1	31.5
Hou_BUPT_task4_1	Hou_BUPT_1	Hou2018	19.6	38.6	18.4	3.5	22.2	20.4	31.5	1.4	14.4	37.6	8.5
Hou_BUPT_task4_2	Hou_BUPT_2	Hou2018	18.9	38.9	15.0	5.7	16.5	16.5	35.1	2.0	15.5	35.4	8.7
Hou_BUPT_task4_3	Hou_BUPT_3	Hou2018	20.9	43.8	12.2	10.0	23.4	18.3	9.2	10.9	15.6	37.3	28.4
Hou_BUPT_task4_4	Hou_BUPT_4	Hou2018	21.1	41.4	16.4	6.4	23.5	20.2	9.8	6.2	14.0	40.6	32.3
CANCES_IRIT_task4_1	IRIT_WGRU_GRU_fusion	Cances2018	8.4	2.5	5.9	0.5	0.3	1.8	17.7	20.9	8.6	4.0	21.6
PELLEGRINI_IRIT_task4_2	IRIT_MIL	Cances2018	16.6	23.8	5.1	25.3	0.7	4.1	6.5	18.3	15.0	22.3	44.9
Kothinti_JHU_task4_1	JHU_T4	Kothinti2018	20.6	36.0	13.0	20.0	13.1	24.4	22.0	0.0	10.4	34.5	32.7
Kothinti_JHU_task4_2	JHU_T4	Kothinti2018	20.9	32.5	21.7	18.6	13.4	25.4	24.7	0.0	7.8	34.2	31.3
Kothinti_JHU_task4_3	JHU_T4	Kothinti2018	20.9	37.2	20.4	17.8	12.4	24.5	16.9	0.0	10.4	34.0	35.1
Kothinti_JHU_task4_4	JHU_T4	Kothinti2018	22.4	36.7	22.0	20.5	12.8	26.5	24.3	0.0	9.6	34.3	37.0
Koutini_JKU_task4_1	JKU_rcnn_threshold	Koutini2018	21.5	30.0	16.4	13.1	9.5	8.4	23.5	18.1	12.6	42.9	40.8
Koutini_JKU_task4_2	JKU_rcnn_prec	Koutini2018	21.1	30.0	15.8	13.1	9.5	8.4	23.5	17.6	12.1	42.0	39.2
Koutini_JKU_task4_3	JKU_rcnn_prec2	Koutini2018	20.6	30.0	15.8	12.9	9.3	8.5	22.7	16.1	12.3	40.9	37.6
Koutini_JKU_task4_4	JKU_rcnn_uth	Koutini2018	18.8	29.2	15.1	12.6	9.5	9.4	22.1	15.2	12.2	41.1	21.4
Liu_USTC_task4_1	USTC_NEL1	Liu2018	27.3	44.2	20.7	23.1	15.2	18.1	30.6	8.7	20.8	43.3	48.8
Liu_USTC_task4_2	USTC_NEL2	Liu2018	28.8	46.0	27.1	21.6	10.8	26.5	42.0	11.0	20.9	33.5	48.6
Liu_USTC_task4_3	USTC_NEL3	Liu2018	28.1	41.7	28.4	22.9	9.2	26.7	33.3	10.3	21.6	43.1	43.9
Liu_USTC_task4_4	USTC_NEL4	Liu2018	29.9	46.0	27.1	20.3	13.0	26.5	37.6	10.9	23.9	43.1	50.0
LJK_PSH_task4_1	LJK_PSH_task4_1	Lu2018	24.1	23.1	32.6	1.2	0.0	5.0	51.4	36.0	30.4	14.0	46.7
LJK_PSH_task4_2	LJK_PSH_task4_2	Lu2018	26.3	25.1	36.1	1.9	0.4	3.1	52.1	42.4	36.2	16.7	49.1
LJK_PSH_task4_3	LJK_PSH_task4_3	Lu2018	29.5	48.0	30.4	2.3	3.7	20.1	46.8	29.4	27.9	41.4	44.6
LJK_PSH_task4_4	LJK_PSH_task4_4	Lu2018	32.4	49.9	38.2	3.6	3.2	18.1	48.7	35.4	31.2	46.8	48.3
Moon_YONSEI_task4_1	Yonsei_str_1	Moon2018	15.9	26.3	14.0	9.8	6.3	15.7	10.4	8.7	11.0	29.6	27.5
Moon_YONSEI_task4_2	Yonsei_str_2	Moon2018	14.3	17.8	14.9	8.1	2.0	10.3	14.6	13.7	12.7	17.3	31.7
Raj_IITKGP_task4_1	Raj_IIT_KGP_Task4_1	Raj2018	9.4	5.1	7.2	1.0	0.3	2.3	15.9	20.4	6.6	0.3	34.9
Lim_ETRI_task4_1	Lim_task4_1	Lim2018	17.1	10.0	20.8	4.8	0.6	6.2	29.1	18.3	16.4	11.2	53.1
Lim_ETRI_task4_2	Lim_task4_2	Lim2018	18.0	12.9	22.5	4.9	0.6	7.0	30.5	19.7	16.5	11.9	53.2
Lim_ETRI_task4_3	Lim_task4_3	Lim2018	19.6	10.2	20.5	6.8	5.9	16.9	25.4	13.5	13.2	20.2	63.3
Lim_ETRI_task4_4	Lim_task4_4	Lim2018	20.4	11.6	21.6	7.9	5.9	17.4	27.8	14.9	15.5	21.0	60.0
WangJun_BUPT_task4_2	BUPT_Attention	WangJ2018	17.9	40.3	14.5	19.0	6.1	4.6	18.6	20.4	18.3	26.0	11.3
DCASE2018 baseline	Baseline	Serizel2018	10.8	4.8	12.7	2.9	0.4	2.4	20.0	24.5	10.1	0.1	30.2
Baseline_Surrey_task4_1	SurreyCNN8	Kong2018	18.6	6.0	18.9	2.4	0.0	3.6	46.4	43.6	15.2	0.0	50.0
Baseline_Surrey_task4_2	SurreyCNN4	Kong2018	16.7	5.5	16.3	2.5	0.0	4.0	44.1	42.5	13.5	0.0	38.8
Baseline_Surrey_task4_3	SurreyFuse	Kong2018	24.0	24.5	18.9	7.8	7.7	5.6	46.4	43.6	15.2	19.9	50.0

System characteristics

General characteristics

Code	Technical Report	Event-based F-score (Eval)	Input	Sampling rate	Data augmentation	Features
Avdeeva_ITMO_task4_1	Avdveeva2018	20.1	mono	16kHz	time stretching, pitch shifting	log-mel energies
Avdeeva_ITMO_task4_2	Avdveeva2018	19.5	mono	16kHz	time stretching, pitch shifting	log-mel energies
Wang_NUDT_task4_1	WangD2018	12.4	mono	44.1kHz	mixup	log-mel energies, delta features
Wang_NUDT_task4_2	WangD2018	12.6	mono	44.1kHz	mixup	log-mel energies, delta features
Wang_NUDT_task4_3	WangD2018	12.0	mono	44.1kHz	mixup	log-mel energies, delta features
Wang_NUDT_task4_4	WangD2018	12.2	mono	44.1kHz	mixup	log-mel energies, delta features
Dinkel_SJTU_task4_1	Dinkel2018	10.4	mono	44.1kHz		MFCC, log-mel energies
Dinkel_SJTU_task4_2	Dinkel2018	10.7	mono	44.1kHz		MFCC, log-mel energies
Dinkel_SJTU_task4_3	Dinkel2018	13.4	mono	44.1kHz		MFCC, log-mel energies
Dinkel_SJTU_task4_4	Dinkel2018	11.2	mono	44.1kHz		MFCC, log-mel energies
Guo_THU_task4_1	Guo2018	21.3	mono	44.1kHz		log-mel energies
Guo_THU_task4_2	Guo2018	20.6	mono	44.1kHz		log-mel energies
Guo_THU_task4_3	Guo2018	19.1	mono	44.1kHz		log-mel energies
Guo_THU_task4_4	Guo2018	19.0	mono	44.1kHz		log-mel energies
Harb_TUG_task4_1	Harb2018	19.4	mono	44.1kHz		log-mel energies
Harb_TUG_task4_2	Harb2018	15.7	mono	44.1kHz		log-mel energies
Harb_TUG_task4_3	Harb2018	21.6	mono	44.1kHz		log-mel energies
Hou_BUPT_task4_1	Hou2018	19.6	mono	16kHz		log-mel energies
Hou_BUPT_task4_2	Hou2018	18.9	mono	16kHz		log-mel energies
Hou_BUPT_task4_3	Hou2018	20.9	mono	16kHz		log-mel energies
Hou_BUPT_task4_4	Hou2018	21.1	mono	16kHz		log-mel energies
CANCES_IRIT_task4_1	Cances2018	8.4	mono	44.1kHz		log-mel energies
PELLEGRINI_IRIT_task4_2	Cances2018	16.6	mono	44.1kHz		log-mel energies
Kothinti_JHU_task4_1	Kothinti2018	20.6	mono	44.1kHz		log-mel energies, auditory spectrogram
Kothinti_JHU_task4_2	Kothinti2018	20.9	mono	44.1kHz		log-mel energies, auditory spectrogram
Kothinti_JHU_task4_3	Kothinti2018	20.9	mono	44.1kHz		log-mel energies, auditory spectrogram
Kothinti_JHU_task4_4	Kothinti2018	22.4	mono	44.1kHz		log-mel energies, auditory spectrogram
Koutini_JKU_task4_1	Koutini2018	21.5	mono	44.1kHz		log-mel energies
Koutini_JKU_task4_2	Koutini2018	21.1	mono	44.1kHz		log-mel energies
Koutini_JKU_task4_3	Koutini2018	20.6	mono	44.1kHz		log-mel energies
Koutini_JKU_task4_4	Koutini2018	18.8	mono	44.1kHz		log-mel energies
Liu_USTC_task4_1	Liu2018	27.3	mono	44.1kHz		log-mel energies
Liu_USTC_task4_2	Liu2018	28.8	mono	44.1kHz		log-mel energies
Liu_USTC_task4_3	Liu2018	28.1	mono	44.1kHz		log-mel energies
Liu_USTC_task4_4	Liu2018	29.9	mono	44.1kHz		log-mel energies
LJK_PSH_task4_1	Lu2018	24.1	mono	22.05kHz		log-mel energies
LJK_PSH_task4_2	Lu2018	26.3	mono	22.05kHz		log-mel energies
LJK_PSH_task4_3	Lu2018	29.5	mono	22.05kHz		log-mel energies
LJK_PSH_task4_4	Lu2018	32.4	mono	22.05kHz		log-mel energies
Moon_YONSEI_task4_1	Moon2018	15.9	mono	22.05kHz	time stretching, pitch shifting, block mixing, DRC	raw waveforms
Moon_YONSEI_task4_2	Moon2018	14.3	mono	22.05kHz	time stretching, pitch shifting, block mixing, DRC	raw waveforms
Raj_IITKGP_task4_1	Raj2018	9.4	mono	44.1kHz		CQT
Lim_ETRI_task4_1	Lim2018	17.1	mono	16kHz	time stretching, pitch shifting, reversing	log-mel energies
Lim_ETRI_task4_2	Lim2018	18.0	mono	16kHz	time stretching, pitch shifting, reversing	log-mel energies
Lim_ETRI_task4_3	Lim2018	19.6	mono	16kHz	time stretching, pitch shifting, reversing	log-mel energies
Lim_ETRI_task4_4	Lim2018	20.4	mono	16kHz	time stretching, pitch shifting, reversing	log-mel energies
WangJun_BUPT_task4_2	WangJ2018	17.9	mono	44.1kHz		log-mel energies
DCASE2018 baseline	Serizel2018	10.8	mono	44.1kHz		log-mel energies
Baseline_Surrey_task4_1	Kong2018	18.6	mono	32kHz		log-mel energies
Baseline_Surrey_task4_2	Kong2018	16.7	mono	32kHz		log-mel energies
Baseline_Surrey_task4_3	Kong2018	24.0	mono	32kHz		log-mel energies

Machine learning characteristics

Code	Technical Report	Event-based F-score (Eval)	Model complexity	Classifier	Ensemble subsystems	Decision making
Avdeeva_ITMO_task4_1	Avdveeva2018	20.1	200242	CRNN, CNN	2	hierarchical
Avdeeva_ITMO_task4_2	Avdveeva2018	19.5	200242	CRNN, CNN	2	hierarchical
Wang_NUDT_task4_1	WangD2018	12.4	24210492	CRNN	3	mean probability
Wang_NUDT_task4_2	WangD2018	12.6	24210492	CRNN	3	mean probability
Wang_NUDT_task4_3	WangD2018	12.0	24210492	CRNN	3	mean probability
Wang_NUDT_task4_4	WangD2018	12.2	24210492	CRNN	3	mean probability
Dinkel_SJTU_task4_1	Dinkel2018	10.4	1781259	HMM-GMM, GRU
Dinkel_SJTU_task4_2	Dinkel2018	10.7	126219	HMM-GMM, CRNN
Dinkel_SJTU_task4_3	Dinkel2018	13.4	126219	HMM-GMM, CRNN
Dinkel_SJTU_task4_4	Dinkel2018	11.2	126090	CRNN
Guo_THU_task4_1	Guo2018	21.3	970644	multi-scale CRNN	2
Guo_THU_task4_2	Guo2018	20.6	970644	multi-scale CRNN	2
Guo_THU_task4_3	Guo2018	19.1	970644	multi-scale CRNN	2
Guo_THU_task4_4	Guo2018	19.0	970644	multi-scale CRNN	2
Harb_TUG_task4_1	Harb2018	19.4	497428	CRNN, VAT
Harb_TUG_task4_2	Harb2018	15.7	497428	CRNN, VAT
Harb_TUG_task4_3	Harb2018	21.6	497428	CRNN, VAT
Hou_BUPT_task4_1	Hou2018	19.6	1166484	CRNN
Hou_BUPT_task4_2	Hou2018	18.9	1166484	CRNN
Hou_BUPT_task4_3	Hou2018	20.9	1166484	CRNN
Hou_BUPT_task4_4	Hou2018	21.1	1166484	CRNN
CANCES_IRIT_task4_1	Cances2018	8.4	126090	CRNN
PELLEGRINI_IRIT_task4_2	Cances2018	16.6	1040724	CNN, CRNN with Multi-Instance Learning
Kothinti_JHU_task4_1	Kothinti2018	20.6	1540854	CRNN, RBM, cRBM, PCA
Kothinti_JHU_task4_2	Kothinti2018	20.9	1540854	CRNN, RBM, cRBM, PCA
Kothinti_JHU_task4_3	Kothinti2018	20.9	1189290	CRNN, RBM, cRBM, PCA
Kothinti_JHU_task4_4	Kothinti2018	22.4	1540854	CRNN, RBM, cRBM, PCA
Koutini_JKU_task4_1	Koutini2018	21.5	126090	CRNN
Koutini_JKU_task4_2	Koutini2018	21.1	126090	CRNN
Koutini_JKU_task4_3	Koutini2018	20.6	126090	CRNN
Koutini_JKU_task4_4	Koutini2018	18.8	126090	CRNN
Liu_USTC_task4_1	Liu2018	27.3	3478026	Capsule-RNN, ensemble	8	dynamic threshold
Liu_USTC_task4_2	Liu2018	28.8	534460	Capsule-RNN, ensemble	2	dynamic threshold
Liu_USTC_task4_3	Liu2018	28.1	4012486	Capsule-RNN, CRNN, ensemble	9	dynamic threshold
Liu_USTC_task4_4	Liu2018	29.9	4012486	Capsule-RNN, CRNN, ensemble	10	dynamic threshold
LJK_PSH_task4_1	Lu2018	24.1	1382246	CRNN	4	mean probabilities
LJK_PSH_task4_2	Lu2018	26.3	1382246	CRNN	2	mean probabilities
LJK_PSH_task4_3	Lu2018	29.5	1382246	CRNN
LJK_PSH_task4_4	Lu2018	32.4	1382246	CRNN
Moon_YONSEI_task4_1	Moon2018	15.9	10902218	GLU, Bi-RNN, ResNet, SENet, Multi-level
Moon_YONSEI_task4_2	Moon2018	14.3	10902218	GLU, Bi-RNN, ResNet, SENet, Multi-level
Raj_IITKGP_task4_1	Raj2018	9.4	215890	CRNN
Lim_ETRI_task4_1	Lim2018	17.1	239338	CRNN
Lim_ETRI_task4_2	Lim2018	18.0	239338	CRNN
Lim_ETRI_task4_3	Lim2018	19.6	239338	CRNN
Lim_ETRI_task4_4	Lim2018	20.4	239338	CRNN
WangJun_BUPT_task4_2	WangJ2018	17.9	1263508	RNN,BGRU,self-attention
DCASE2018 baseline	Serizel2018	10.8	126090	CRNN
Baseline_Surrey_task4_1	Kong2018	18.6	4691274	VGGish 8 layer CNN with global max pooling
Baseline_Surrey_task4_2	Kong2018	16.7	4309450	AlexNetish 4 layer CNN with global max pooling
Baseline_Surrey_task4_3	Kong2018	24.0	4691274	VGGish 8 layer CNN with global max pooling, fuse SED and non-SED

Technical reports

Sound Event Detection Using Weakly Labeled Dataset with Convolutional Recurrent Neural Network

Avdeeva, Anastasia and Agafonov, Iurii

Speech Information Systems Department, University of Information Technology Mechanics and Optics, Saint-Petersburg, Russia

Avdeeva_ITMO_task4_1 Avdeeva_ITMO_task4_2

Input	mono
Sampling rate	16kHz
Data augmentation	time stretching, pitch shifting
Features	log-mel energies
Classifier	CRNN, CNN
Decision making	hierarchical

Content

Task description

Systems ranking

Teams ranking

Class-wise performance

System characteristics

General characteristics

Machine learning characteristics

Technical reports

Sound Event Detection Using Weakly Labeled Dataset with Convolutional Recurrent Neural Network

Sound Event Detection Using Weakly Labeled Dataset with Convolutional Recurrent Neural Network

Abstract

System characteristics

SOUND EVENT DETECTION FROM WEAK ANNOTATIONS: WEIGHTED GRU VERSUS MULTI-INSTANCE LEARNING

SOUND EVENT DETECTION FROM WEAK ANNOTATIONS: WEIGHTED GRU VERSUS MULTI-INSTANCE LEARNING

Abstract

System characteristics

A HYBRID ASR MODEL APPROACH ON WEAKLY LABELED SCENE CLASSIFICATION

A HYBRID ASR MODEL APPROACH ON WEAKLY LABELED SCENE CLASSIFICATION

Abstract

System characteristics

MULTI-SCALE CONVOLUTIONAL RECURRENT NEURAL NETWORK WITH ENSEMBLE METHOD FOR WEAKLY LABELED SOUND EVENT DETECTION

MULTI-SCALE CONVOLUTIONAL RECURRENT NEURAL NETWORK WITH ENSEMBLE METHOD FOR WEAKLY LABELED SOUND EVENT DETECTION

Abstract

System characteristics

SOUND EVENT DETECTION USING WEAKLY LABELED SEMI-SUPERVISED DATA WITH GCRNNS, VAT AND SELF-ADAPTIVE LABEL REFINEMENT

SOUND EVENT DETECTION USING WEAKLY LABELED SEMI-SUPERVISED DATA WITH GCRNNS, VAT AND SELF-ADAPTIVE LABEL REFINEMENT

Abstract

System characteristics

Semi-supervised sound event detection with convolutional recurrent neural network using weakly labelled data

Semi-supervised sound event detection with convolutional recurrent neural network using weakly labelled data

Abstract

System characteristics

DCASE 2018 Challenge Baseline with Convolutional Neural Networks

DCASE 2018 Challenge Baseline with Convolutional Neural Networks

Abstract

System characteristics

JOINT ACOUSTIC AND CLASS INFERENCE FOR WEAKLY SUPERVISED SOUND EVENT DETECTION

JOINT ACOUSTIC AND CLASS INFERENCE FOR WEAKLY SUPERVISED SOUND EVENT DETECTION

Abstract

System characteristics

ITERATIVE KNOWLEDGE DISTILLATION IN R-CNNS FOR WEAKLY-LABELED SEMI-SUPERVISED SOUND EVENT DETECTION

ITERATIVE KNOWLEDGE DISTILLATION IN R-CNNS FOR WEAKLY-LABELED SEMI-SUPERVISED SOUND EVENT DETECTION

Abstract

System characteristics

WEAKLY LABELED SEMI-SUPERVISED SOUND EVENT DETECTION USING CRNN WITH INCEPTION MODULE

WEAKLY LABELED SEMI-SUPERVISED SOUND EVENT DETECTION USING CRNN WITH INCEPTION MODULE

Abstract

System characteristics

USTC-NELSLIP SYSTEM FOR DCASE 2018 CHALLENGE TASK 4

USTC-NELSLIP SYSTEM FOR DCASE 2018 CHALLENGE TASK 4

Abstract

System characteristics

MEAN TEACHER CONVOLUTION SYSTEM FOR DCASE 2018 TASK 4

MEAN TEACHER CONVOLUTION SYSTEM FOR DCASE 2018 TASK 4

Abstract

System characteristics

End-to-end CRNN Architectures for Weakly Supervised Sound Event Detection

End-to-end CRNN Architectures for Weakly Supervised Sound Event Detection

Abstract

System characteristics

LARGE-SCALE WEAKLY LABELLED SEMI-SUPERVISED CQT BASED SOUND EVENT DETECTION IN DOMESTIC ENVIRONMENTS

LARGE-SCALE WEAKLY LABELLED SEMI-SUPERVISED CQT BASED SOUND EVENT DETECTION IN DOMESTIC ENVIRONMENTS

Abstract

System characteristics

LARGE-SCALE WEAKLY LABELED SEMI-SUPERVISED SOUND EVENT DETECTION IN DOMESTIC ENVIRONMENTS

LARGE-SCALE WEAKLY LABELED SEMI-SUPERVISED SOUND EVENT DETECTION IN DOMESTIC ENVIRONMENTS

Abstract

System characteristics

A CRNN-BASED SYSTEM WITH MIXUP TECHNIQUE FOR LARGE-SCALE WEAKLY LABELED SOUND EVENT DETECTION

A CRNN-BASED SYSTEM WITH MIXUP TECHNIQUE FOR LARGE-SCALE WEAKLY LABELED SOUND EVENT DETECTION

Abstract

System characteristics

SELF-ATTENTION MECHANISM BASED SYSTEM FOR DCASE2018 CHALLENGE TASK1 AND TASK4

SELF-ATTENTION MECHANISM BASED SYSTEM FOR DCASE2018 CHALLENGE TASK1 AND TASK4

Abstract

System characteristics