Tanasa, D. and Trousse, B. (2004) Advanced Data Preprocessing for Intersites Web Usage Mining. IEEE Transaction on Intelligent Systems, 19, 59-65. - References

Journals by Subject

Publish with us

Follow SCIRP

	+1 323-425-8868
	customer@scirp.org
	+86 18163351462(WhatsApp)
	1655362766

	Paper Publishing WeChat

Article citationsMore>>

Tanasa, D. and Trousse, B. (2004) Advanced Data Preprocessing for Intersites Web Usage Mining. IEEE Transaction on Intelligent Systems, 19, 59-65.

has been cited by the following article:

TITLE: An Efficient Agglomerative Clustering Algorithm for Web Navigation Pattern Identification

AUTHORS: A. Anitha

KEYWORDS: Agglomerative Clustering, Similarity Measure, Cluster Validity, Clickstream Sequence, Transaction

JOURNAL NAME: Circuits and Systems, Vol.7 No.9, July 19, 2016

ABSTRACT: Web log mining is analysis of web log files with web page sequences. Discovering user access patterns from web access are necessary for building adaptive web servers, to improve e-commerce, to carry out cross-marketing, for web personalization, to predict web access sequence etc. In this paper, a new agglomerative clustering technique is proposed to identify users with similar interest, and to determine the motivation for visiting a website. Using this approach, web usage mining is done through different stages namely data cleaning, preprocessing, pattern discovery and pattern analysis. Results are given to explain how this approach produces tight usage clusters than the existing web usage mining techniques. Rather than traditional distance based clustering, the similarity measure is considered during clustering process in order to reduce computational complexity. This paper also deals with the problem of assessing the quality of user session clusters and cluster validity is measured by using statistical test, which measures the distances of clusters distributions to infer their dissimilarity and distinguish level. Using such statistical measures, it is proved that cluster accuracy is improved to the extent of 0.83, over existing k-means clustering with validity measure 0.26, FCM (Fuzzy C Means) clustering with validity measure 0.56. Rough set based clustering with validity measure 0.54 Generation of dense clusters is essential for finding interesting patterns needed for further mining and analysis.

Open Access

Articles

Intelligent Sign Multi-Language Real-Time Prediction System with Effective Data Preprocessing

Doaa E. Elmatary, Doaa M. Maher, Areeg Tarek Ibrahim

Journal of Computer and Communications Vol.11 No.10, October 27, 2023

DOI: 10.4236/jcc.2023.1110008
Open Access

Articles

The Optimization and Improvement of MapReduce in Web Data Mining

Jun Qu, Chang-Qing Yin, Shangwei Song

Journal of Software Engineering and Applications Vol.8 No.8, August 24, 2015

DOI: 10.4236/jsea.2015.88039
Open Access

Articles

Text and Data Mining in Directive 2019/790/EU Enhancing Web-Harvesting and Web-Archiving in Libraries and Archives

Μaria Bottis, Marinos Papadopoulos, Christos Zampakolas, Paraskevi Ganatsiou

Open Journal of Philosophy Vol.9 No.3, August 28, 2019

DOI: 10.4236/ojpp.2019.93024
Open Access

Articles

Cloud-Based Information Technology Framework for Data Driven Intelligent Transportation Systems

Arshdeep Bahga, Vijay K. Madisetti

Journal of Transportation Technologies Vol.3 No.2, April 29, 2013

DOI: 10.4236/jtts.2013.32013
Open Access

Articles

Empirical Research on Web Harvesting in the Process of Text and Data Mining in National Libraries of EU Member States

Marinos Papadopoulos, Maria Botti, M. A. Paraskevi (Vicky) Ganatsiou, Christos Zampakolas

Open Journal of Philosophy Vol.10 No.1, February 7, 2020

DOI: 10.4236/ojpp.2020.101007

Follow SCIRP

	+1 323-425-8868
	customer@scirp.org
	+86 18163351462(WhatsApp)
	1655362766

	Paper Publishing WeChat

Journals by Subject

Publish with us

Article citationsMore>>

Home

About SCIRP

Service

Policies