Workload Characterization for the Multimedia Files Embedded in the Popular Web Pages

A. Abhari and M. Soraya (Canada)


Web   objects,   embedded   objects,   multimedia   files, workload characterization, heavy­tailed distribution. 1.


Characterization of popular Web pages is essential to study   issues   such   as   proxy   cache   performance   and inspection of effective resource management algorithms in Web. In this paper we used Web objects for such a characterization.  A Web  object is  a  Web page  and  a collection of files corresponding to the embedded objects which must be transferred to display the Web page. We collected   data   on   the   size   and   number   of   embedded objects to propose models for web objects.   Due to the increase   of   the   number   of   Web   pages   consisting   of multimedia embedded objects in recent years, finding a suitable model for the Web objects including multimedia files has become an important issue. Characterization of multimedia files embedded in the Web objects is also valuable in improving their related Web page download time. In this paper, we present a characterization of top 500 popular Web sites that fall into three different data sets: February 2006, February 2005, and February 2004. We have considered the popular Web pages for this study because they are more likely to be efficiently designed and they have significant impact on network traffic. This characterization shows the impacts of embedding multimedia   files   in   the   distribution   models   that   we suggest for popular Web pages. This result can be used for development of workload generators that exhibit the properties of Web objects such as number of embedded objects and their sizes.

